Skip to content
ℕ𝔸𝕊𝔸™ℕ𝕒𝕤𝕒𝕣𝕖™𝕊𝕡𝕒𝕔𝕖𝕏™ https://nasa.re/

Nasare™🚀

フレッシュ スペース & テクノロジー NEWS📢

  • About 𝒩𝒶𝓈𝒶𝓇𝑒™
  • SMART Tools
  • SMART AI
    • Kubeshark PCAP Export/Import
    • Coaching engineering managers to employ on organizational issues
    • Zelda: Hyperlink’s Awakening game engine documentation (2021)
    • Commercial Resupply Services-CRS
  • Show HN
    • WINd3x、iPod Bootrom エクスプロイトは 10 年遅かった
    • Just by Notでプログラミングするシステム オブジェクト指向プログラミングの活用
    • 主な BGP 増加をレジデンス Windows デスクトップに追加する
    • ガジェットの複雑さが増し、余分な IP の再利用が促進される
    • 新しい GitHub CLI 拡張インストゥルメント
    • Kubernetes を 7,500 ノードにスケーリング (2021 年)
    • Wander アプリ用の軽量なオンザフリット構成ライブラリ
    • Ask HN
      • Declare HN: I wrote a WebAssembly Interpreter and Toolkit in C
      • Describe HN: Kandria, an action RPG made in Frequent Voice, is now out
      • Demonstrate HN: ClickHouse-local – a runt instrument for serverless files analytics
      • Brand HN: Motion photographs Watchlist Chrome Extension
      • Existing HN: Connmap – Desktop widget that reveals your TCP company on an international diagram
      • Level to HN: An initiate source tool to generate Jet Engine compressors
      • Insist HN: Ov – characteristic smartly off terminal pager
      • Level to HN: Graphic-Walker – A special kind of originate-offer different to Tableau
      • Level to HN: A corpulent game of snake encoded in a url
      • Point out HN: Kweb: A a ways away interface to the earn browser’s DOM
      • Present HN: Nanelo DNS – Privacy-Kindly, European Nameservers
      • Reward HN: Vim on-line editor the exercise of WebAssembly, storing files the exercise of IndexedDB
      • Show HN: AREnets – TensorFlow-basically based mostly Relation Extraction equipment for work in Colab
      • Speak HN: What sub $200 product improved HN readers’ 2022
      • Uncover HN: Easy internet app for teenagers to management a single Philips Hue light
      • Advise HN: Daft Art – an album veil maker powered by AI and curated aesthetics
    • Show HN
      • Reward HN: Vim on-line editor the exercise of WebAssembly, storing files the exercise of IndexedDB
      • Android phones will at the moment obtain iPhone-love SOS satellite texting
      • Demonstrate HN: ClickHouse-local – a runt instrument for serverless files analytics
      • Show HN: AREnets – TensorFlow-basically based mostly Relation Extraction equipment for work in Colab
      • Present HN: Nanelo DNS – Privacy-Kindly, European Nameservers
      • Insist HN: Ov – characteristic smartly off terminal pager
      • Level to HN: An initiate source tool to generate Jet Engine compressors
      • Speak HN: What sub $200 product improved HN readers’ 2022
      • Advise HN: Daft Art – an album veil maker powered by AI and curated aesthetics
      • Uncover HN: Easy internet app for teenagers to management a single Philips Hue light
      • Level to HN: A corpulent game of snake encoded in a url
    • Brand HN: Motion photographs Watchlist Chrome Extension
    • Existing HN: Connmap – Desktop widget that reveals your TCP company on an international diagram
    • Point out HN: Kweb: A a ways away interface to the earn browser’s DOM
    • Declare HN: I wrote a WebAssembly Interpreter and Toolkit in C
    • Tag HN: Using Key-Value Retail outlets in Serverless Codehooks.io Applications
    • Declare HN: I wrote a WebAssembly Interpreter and Toolkit in C
    • Point out HN: Kweb: A a ways away interface to the earn browser’s DOM
    • Existing HN: Connmap – Desktop widget that reveals your TCP company on an international diagram
    • Brand HN: Motion photographs Watchlist Chrome Extension
    • Level to HN: A corpulent game of snake encoded in a url
    • Uncover HN: Easy internet app for teenagers to management a single Philips Hue light
    • Advise HN: Daft Art – an album veil maker powered by AI and curated aesthetics
    • Speak HN: What sub $200 product improved HN readers’ 2022
    • Level to HN: An initiate source tool to generate Jet Engine compressors
    • Level to HN: Graphic-Walker – A special kind of originate-offer different to Tableau
    • Insist HN: Ov – characteristic smartly off terminal pager
    • Present HN: Nanelo DNS – Privacy-Kindly, European Nameservers
    • Show HN: AREnets – TensorFlow-basically based mostly Relation Extraction equipment for work in Colab
    • Demonstrate HN: ClickHouse-local – a runt instrument for serverless files analytics
    • Reward HN: Vim on-line editor the exercise of WebAssembly, storing files the exercise of IndexedDB
  • A Computer virus and a Dilemma
    • OCIS – OwnCloud Countless Scale
    • A Princeton student built an app which is ready to detect if ChatGPT wrote an essay
    • GitHub Is Sued, and We Would possibly perhaps Learn Something About Creative Commons Licensing
    • Adobe’s Command material analysis can be using photos/videos to narrate AI w/o consent
    • Ultralearning a.k.a. how I learned to code
    • Automatic1111 is assist on GitHub after taking away Embedding Links
    • Where Your Sides Came From
    • What Is a Pig Butchering Rip-off?
    • Submit-processing is ruining iPhone photos
    • Clos Topologies and Centralized Retain a watch on in Google’s Datacenter Community
    • Miller Engineering DS-1 House Planetarium
    • Gimel Studio: Non-harmful, 2D image editor
  • Technology
    • Miller Engineering DS-1 House Planetarium
    • Apple Doctors: to construct it as a file it is advisable to electronic mail it to your self
    • The Air India passenger who urinated on a girl has been fired by Wells Fargo
    • The Filesystem Hierarchy Usual Comes to Guix Containers
    • Sooner than it sued Google for copying from Java, Oracle changed into as soon as copying IBM’s SQL (2020)
    • The i3-gaps mission has been merged with i3
    • Making an Alphorn from Scratch
    • Apple: Braille Individual Guides
    • MotherDuck Is a Original Thought
    • The class of CGI and simple make
    • Like a mercurial tour of DragonFly BSD 6.4?
    • computer science
    • AI
    • Artificial intelligence
    • Technology
    • Ai
    • Apple
    • digital
  • TOP HN
    • anti-Mastodon
    • TOP HN
      • Show HN
      • Ask HN
      • coding
      • ガジェットの複雑さが増し、余分な IP の再利用が促進される
      • 新しい GitHub CLI 拡張インストゥルメント
      • Kubernetes を 7,500 ノードにスケーリング (2021 年)
      • Just by Notでプログラミングするシステム オブジェクト指向プログラミングの活用
      • Describe HN: Kandria, an action RPG made in Frequent Voice, is now out
      • WINd3x、iPod Bootrom エクスプロイトは 10 年遅かった
      • Wander アプリ用の軽量なオンザフリット構成ライブラリ
      • Artificial intelligence
      • 主な BGP 増加をレジデンス Windows デスクトップに追加する
      • Technology
      • Level to HN: Graphic-Walker – A special kind of originate-offer different to Tableau
      • Declare HN: I wrote a WebAssembly Interpreter and Toolkit in C
      • Point out HN: Kweb: A a ways away interface to the earn browser’s DOM
      • Existing HN: Connmap – Desktop widget that reveals your TCP company on an international diagram
      • Advise HN: Daft Art – an album veil maker powered by AI and curated aesthetics
      • Brand HN: Motion photographs Watchlist Chrome Extension
      • Declare HN: I wrote a WebAssembly Interpreter and Toolkit in C
      • Demonstrate HN: ClickHouse-local – a runt instrument for serverless files analytics
      • Describe HN: Kandria, an action RPG made in Frequent Voice, is now out
      • Existing HN: Connmap – Desktop widget that reveals your TCP company on an international diagram
      • Insist HN: Ov – characteristic smartly off terminal pager
      • Just by Notでプログラミングするシステム オブジェクト指向プログラミングの活用
      • Kubernetes を 7,500 ノードにスケーリング (2021 年)
      • Level to HN: A corpulent game of snake encoded in a url
      • Level to HN: An initiate source tool to generate Jet Engine compressors
      • Level to HN: Graphic-Walker – A special kind of originate-offer different to Tableau
      • Point out HN: Kweb: A a ways away interface to the earn browser’s DOM
      • Present HN: Nanelo DNS – Privacy-Kindly, European Nameservers
      • Reward HN: Vim on-line editor the exercise of WebAssembly, storing files the exercise of IndexedDB
      • Show HN: AREnets – TensorFlow-basically based mostly Relation Extraction equipment for work in Colab
      • Speak HN: What sub $200 product improved HN readers’ 2022
      • Uncover HN: Easy internet app for teenagers to management a single Philips Hue light
      • Wander アプリ用の軽量なオンザフリット構成ライブラリ
      • WINd3x、iPod Bootrom エクスプロイトは 10 年遅かった
      • ガジェットの複雑さが増し、余分な IP の再利用が促進される
      • 主な BGP 増加をレジデンス Windows デスクトップに追加する
      • 新しい GitHub CLI 拡張インストゥルメント
      • ロンドンで*ダウン*を継続的に見つめる: Pavement Oddities
      • 報酬 HN: C の 30 行でスピンロック
      • FAA の NOTAM とは何ですか? 航空専門家が機械の仕組みを説明
      • ナノGPT
      • 1 ビット LCD のグレースケール (2022)
      • The Muse (YC W12) は FP&A のシニア ディレクターを採用しています
      • Zen (YC S21) はグロース エンジニアを採用しています
      • Tall Inquire of (YC W21) が B2B 回顧録の幹部を採用
      • Actiondesk (YC S19) は、プロダクト ドレスメーカーを採用しています (4-6 か月の契約)
      • Oven (YC S19) は、Bun を作成するために C/C++ または Zig エンジニアを採用しています。
      • WInd3x, the iPod Bootrom exploit 10 years too unhurried
      • Sign HN: FASTA recordsdata を操作するための FUSE モジュール
      • HN を指します: Socketify.py: PyPy3 および Python3 用の Http/Https および WebSocket サーバー
      • Wage Development Continues to Gradual in the UK and Euro House
      • Stage Supervisor for the unimpressed: 1 Getting started
      • First public free up of Pushup: a brand unique compiler for making net apps in Trip
      • Fixing Cart-Pole Swingup with a Hierarchical Controller
      • Flight Testing the Touchdown Radar for Mars Science Laboratory 2011-06-21T17:36:36Z
      • Flightcontrol (YC W22) is hiring first Developer Recommend
      • Flying boats and other tech for cleaner shipping
      • Four Finalist Touchdown Location Candidates for Mars Science Laboratory 2008-11-19T16:21:01Z
      • France’s prized nuclear sector stalled in Europe’s hour of want
      • French startup unveils new residential thermo-acoustic warmth pump
      • FTC Cracks Down on Firms That Impose Contaminated Noncompete Restrictions
      • FTX’s Aged Prime Lawyer Aided US Authorities in Bankman-Fried Case
      • FY18 NASA lėšų šnypštimas 2017-05-22T00:00:00Z
      • G-3PO: A protocol droid for Ghidra, or GPT-3 for reverse-engineering
      • Gail.com FAQ
      • Gemini-Titan (GT)-6 – Gemini 6 of 7 – 지역 사진 – 외부 지역 1965-12-15T00:00:00Z
      • Geoffrey Hinton Publishes Original Deep Learning Algorithm
      • Germany warns: AI fingers flee already underway (2021)
      • Gimel Studio: Non-harmful, 2D image editor
      • GitHub Availability File
      • GitHub Is Sued, and We Would possibly perhaps Learn Something About Creative Commons Licensing
      • Google needs RISC-V to be a “tier-1” Android architecture
      • Google researcher, lengthy out of math, cracks devilish dispute about gadgets
      • Google start sourced CDC File Transfer from the ashes of Stadia
      • GRC-2003-C-02097 2004-05-01T00:00:00Z
      • GRC-2013-C-05246 2009-11-26T00:00:00Z
      • Hello world!
      • Highlights of Science Launching on SpaceX CRS-15 2018-06-24T00:00:00Z
      • Hilf Al-Fudul
      • HiOperator (YC S16) Is Hiring VP of Engineering
      • HN を指します: Socketify.py: PyPy3 および Python3 用の Http/Https および WebSocket サーバー
      • How kind I blueprint a pair of buttocks?
      • How will the haj switch as international temperatures upward thrust?
      • Human gene linked to bigger brains turned into as soon as born from apparently pointless DNA
      • Hundreds of scientists publish a paper every 5 days
      • In Favor of Friction and Flexibility
      • Indicate HN: Klotho – Change into straightforward code into cloud native code
      • Indoor farming isn’t exact for the smartly off
      • Iranian assault drone came across to have parts from more than a dozen US companies
      • Israeli researcher experiences leak of 235M Twitter-linked e-mail addresses
      • Jam Stations in Low Earth Orbit
      • Jazz Is Freedom
      • JPL-20171102-TECHf-0001-ドローントリップ 人間vs機械 2017-11-17T00:00:00Z
      • JPL에서 NASA의 MSI 콘도미니엄 액셀러레이터 2022-08-25T00:00:00Z
      • JPSO extinct facial recognition abilities to arrest a man. The tech modified into once defective
      • jsc2017e136097 – 12 月 4 日,俄罗斯联邦地区公司 (Roscosmos) 的远征 54-55 号机组人员 Anton Shkaplerov 在俄罗斯 Principal person City 的加加林宇航员训练中心上向整洁的祝福者挥手致意,当时他登上了前往附近的 Chkalovsky Ai 的公共汽车2017-12-04T00:00:00Z
      • Kemble’s Cascade of Stars
      • Kepler-90 マシン (アーティストの考え) 2017-12-14T00:00:00Z
      • Koichi Wakata SpaceX 코칭 2022-06-27T00:00:00Z
      • KSC and Proud to Be Heart-Wide Diversity Tournament 2019-08-20T00:00:00Z
      • KSC ir „Proud to Be Center“ įvairovės turnyras 2019-08-20T00:00:00Z
      • AI
      • Artificial intelligence
      • Auto-Generate
      • anti-Mastodon
      • Awesome
      • BioSentinel
      • CATEGORIES
      • DC
      • Dione
      • Diversity
      • drone racing
      • drones
      • Dulles
      • education
      • Event
      • filmstock
      • Goddard
      • AI
      • Ask HN
      • autonomous
      • coding
      • computer science
      • Clusters
      • Artificial intelligence
        • Ai
        • Apple
        • Tesla
        • digital
        • MESSENGER
        • Device
        • Charts
        • change
        • Shows
        • fraud
        • Former
        • fucking
        • purge
        • Works
        • entering
        • Databases
        • Review
        • Strangely
        • Instinct
        • staff
        • Salesforce
        • intern
        • Involuntary
        • promise
        • Twilio’s
        • nisv live
        • attack
        • Iranian
        • France’s
        • prized
        • infrastructure
        • Debian-based
        • nisv s02 ep03
        • siduction
        • Awesome
        • Calculate
        • Beautiful
        • Linux
        • Start
        • dollar
        • Messier
        • Daughters
        • ‘Breakthrough’
        • obesity
        • Al-Fudul
        • sixty years
        • PyTorch
        • discloses
        • Ancient
        • Stone
        • Popup
        • design
        • public
        • expanding
        • cloud
        • forest
        • startup
        • French
        • batteries
        • fleas
        • spotted
        • Petals
        • language
        • Habitual
        • checking
        • GitHub
        • Availability
        • layers
        • inconsistencies
        • Affair
        • Quasi-War
        • Sergey
        • Irate
        • bestseller
        • necessarily
        • Scientists
        • Titan
        • twitch
        • FGS/NIRISS – Fine Guidance Sensor/Near InfraRed Imager and Slitless Spectrograph
        • infrared
        • ISIM – Integrated Science Instrument Module
        • JHU – Johns Hopkins University
        • JWST – James Webb Space Telescope
        • JWST – James Webb Space Telescope
        • absolute zero
        • Big Bang
        • Peace
        • Studio
        • Making
        • project
        • -gaps
        • warns
        • Germany
        • Braille
        • MotherDuck
        • prototype
        • Challenges
        • Infinite
        • OwnCloud
        • Novel
        • Before
        • copying
        • California
        • getting
        • States
        • Criminal
        • Brother
        • Released
        • Method
        • owners
        • ‘richsession’
        • email
        • Elements
        • Where
        • passenger
        • Hierarchy
        • Filesystem
        • economic
        • Crew Dragon
        • Bridenstine
        • Scientific
        • Heaviosity
        • Patterns
        • Unexpected
        • minimalist
        • Ecode
        • Alpha
        • Wolfram
        • Tailwind
        • HiOperator
        • Klotho
        • TEAMS
        • ROBOTICS
        • Antelope
        • Sponsors
        • Ellen Gertsen
        • Transform
        • Flightcontrol
        • subscriptions
        • Internet
        • Theory-building
        • you’re
        • looking
        • Transfer
        • error’
        • Tails
        • migrate
        • Building
        • Bitmovin
        • Remote
        • PhotoRoom
        • Company
        • Taking
        • Ribbon
        • BibDesk
        • Android
        • profilers
        • phones
        • modern
        • Mastercard
        • private
        • We’ve
        • reportedly
        • Microsoft
        • Artsy
        • trades
        • skilled
        • Polygon
        • Flying
        • Princeton
        • Codemods
        • Coaching
        • UK’s
        • popping
        • sourced
        • Wikipedia
        • admin
        • Indoor
        • quick
        • Mysterious
        • Spotify
        • Fancy
        • Spotify
        • Weird
        • mail-order
        • Recipients
        • computer
        • optics
        • partnership
        • commercial
        • telemetry
        • Crisis
        • billionaire
        • Party
        • Onelab
        • Faster
        • general
        • Adobe’s
        • database
        • FinanceDatabase
        • Numerical
        • Freedom
        • concrete
        • Stacks
        • computer science
        • NASA
    • Show HN
    • Ask HN
    • Technology
    • computer science
    • coding
    • Clusters
    • AI
    • drones
    • autonomous
    • Auto-Generate
    • Ask HN
    • Show HN
    • The SMART Science™
    • google
  • CRYPTO
    • Blockchain
    • farming
    • Billionaires
    • FTX’s
    • FinanceDatabase: A database of 300.000 symbols (ETFs, Currencies, Crypto)
  • Artificial intelligence
  • Toggle search form
  • Stage Supervisor for the unimpressed: 1 Getting started
    Stage Supervisor for the unimpressed: 1 Getting started Show HN
  • ChatGPT が Microsoft の Azure OpenAI プロバイダーですぐに利用できるようになりました
    ChatGPT が Microsoft の Azure OpenAI プロバイダーですぐに利用できるようになりました anti-Mastodon
  • 米国がカナダ上空で撃墜した別のUFO
    米国がカナダ上空で撃墜した別のUFO Another
  • Works entering the final public domain this year
    Works entering the final public domain this year NASA
  • GitHub Evolved Safety によるユーティリティ セキュリティ オーケストレーション
    GitHub Evolved Safety によるユーティリティ セキュリティ オーケストレーション anti-Mastodon
  • 1 秒で 1000 件の検査を実行 (JS)
    1 秒で 1000 件の検査を実行 (JS) anti-Mastodon
  • インドのスタートアップ Sure Madam が顧客とギグ ワーカーの機密記録データを発見
    インドのスタートアップ Sure Madam が顧客とギグ ワーカーの機密記録データを発見 anti-Mastodon
  • KSC-04pd-2617 2004-12-15T00:00:00Z
    KSC-04pd-2617 2004-12-15T00:00:00Z Ask HN
  • 単一の GPU で ChatGPT が大好きな優れた言語の実行
    単一の GPU で ChatGPT が大好きな優れた言語の実行 Artificial intelligence
  • Show HN: 音声入力付き ChatGPT
    Show HN: 音声入力付き ChatGPT Audio
  • ESP32 用のギャラガ、パックマン、ドンキーコング エミュレータ
    ESP32 用のギャラガ、パックマン、ドンキーコング エミュレータ Artificial intelligence
  • Recount HN: 視覚的な Excel シートを使用して、より大きな JSON 情報に対処する
    Recount HN: 視覚的な Excel シートを使用して、より大きな JSON 情報に対処する anti-Mastodon
  • ポートレートのIG評判を知った写真家は、画像がAIだったと告白した
    ポートレートのIG評判を知った写真家は、画像がAIだったと告白した Artificial intelligence
  • FBI が PC ネットワークのハッキングを調査
    FBI が PC ネットワークのハッキングを調査 anti-Mastodon
  • California is getting sopping wet. So why can now now not it put water for the drought?
    California is getting sopping wet. So why can now now not it put water for the drought? Technology
Jax での Recordsdata 並列処理によるディープ ネットワークのコーチング

Jax での Recordsdata 並列処理によるディープ ネットワークのコーチング

Posted on February 24, 2023 By 📢 ℕ𝔸𝕊𝔸™
Photo

LLM であるか VLM であるかにかかわらず、鮮やかなニューラル ネットワークを実践する上での主要な課題のいくつかと見なされているのは、それらが鮮やかすぎて単一の GPU に収まらないことです。 . この分野に取り組むために、彼らの練習はおそらく複数の GPU で並列化されるでしょう。 このプロットは、知識またはマネキンを並列化して、計算を複数のデバイスに分散させます。 この記事では、ほとんどの場合情報並列処理と呼ばれるバッチ分割と、複数のデバイス間で計算を並列化するために JAX の pmap 機能を利用するレベルについて説明します。

300M GPT マネキンの並列化

実例から始めましょう。 8 個の Tesla V100 GPU を搭載したマシンで 3 億個のパラメーターを持つ GPT マネキンを練習しているとします。 GPU 間でマネキンを並列化して、最大限に効率的なランタイムを得るにはどうすればよいでしょうか? マネキンには 3 億個のパラメーターがあるため、そのパラメーターを保存するには 1.2 GB の RAM を消費します (ここで認識します (ブランドオリジナルタブで開きます))。 一方、トランスフォーマー マネキンを練習するための回想フットプリントは、アクティベーションによって支配されます。 させて た, DT、DT

,D は、マネキンのシーケンスの長さと隠れた寸法を示します。 と仮定するとた≫DT gg D T≫ D、変圧器の回想フットプリントは おおよそ (ブランドオリジナルタブで開きます):

ま≒Mm oドえl

)B T2 4 んD 2M approx M_{マネキン} frac{BT^2} {4ND^2} M≒

Mm ode

l

4

んD2 B た2

どこ BB

B ) はそのバッチ サイズであり、ん N んはアテンションヘッドの違いです。 では交流しましょう

た=1024 T=1024

た=1024, ん=8N=8 ん= 8、D=128 D=128 D= 128 の場合、式

M≒1.2⋅8 B=9.6 B M 約 1.2 cdot 8 B=9.6 B M≒1.2⋅8B =9.6B

つまり、アクティベーションを保存するには 10

10 10 )バッチ コンポーネントごとに GB のマネキンを準備する必要があります。 最新の Tesla V100 GPU は 32GB の RAM を使用するため、このマネキンをすべてのプランで 3 のバッチ サイズに合わせる必要があることを意味します。 最適な実践状況は、のバッチサイズを満たすことですB=24 B=24B=24 刺して8 つのデバイスにわたるミニバッチ。 最終的なマネキンを RAM に保存する戦略を紹介しますが、制限要素はバッチ サイズです。 これが、この並列化の公式が情報並列化と呼ばれる理由です。すべての計画でマネキンを複製しますが、知識を並列化します。 Jax でのレコードデータ並列化

線形レイヤーのフォワード パスを並列化することを試みて、JAX の情報の並列化の簡単な例を見てみましょう。 最初にレイヤーを介して単一の情報レベルを渡すようにレベルを設定し、次に 1 つのプランで複数のポイントを渡し、複数のデバイスで間接的に複数のポイントを渡します。

線形レイヤー

まず、説明を提示しましょう 簡単な線形層のためのション.

1 つの情報レベル

では、線形層を介して 1 つの情報レベルを渡しましょう。

出力は完全にスカラー

1つのプランで1つ以上の情報ポイント

1 つのプランで複数の情報ポイントをうまく渡すには、vmap 機能を使用して、機能を並行して調べることができます。

出力は、単一のプランに保存された長さ 16 のベクトルです。

複数のデバイスで 1 つ以上の情報ポイント

複数のデバイス間でこの操作を並列化すると機能します。 を使用して)pmap と同じベクトル化された効率が得られます) vmap それにもかかわらず、複数のデバイスで.

出力は形状の行列です (8, 2) 8 つのデバイスに保存されています。 この行列を平坦化すると、 から取得した長さ 16 のベクトルを思い起こさせます。 vmap 。 この状況の非常に厄介な部分は、すべてのデバイスで重みを複製したことです。 in_axes の中に pmap 特徴:

Recordsdata の並列化された線形回帰

書き出すことができるようになりました情報並列処理の練習方法の例。 すべてのミニバッチについて、すべてのプランがパラメーターに関する勾配を計算し、それらを中央サーバーに送信します。 サーバーは勾配を平均化し、結果サポートをすべての計画に送信します。 それぞれの計画は、毎日の勾配を使用してパラメーターの再現を更新します。 これにより、すべての計画が最新のパラメーターを使用してマネキンを実践していることを確認できます。 colab (ブランドオリジナルタブで開きます)ここで、おそらく完全に機能するインスタンスを取得することもできます.

ここでは、functools.partial デコレータは アップデート 機能 pmap と axis_name='num_devices' を への入力引数としてpmap。 このプロット アップデート 機能は、すべてのデバイスに並行して適用されます。 pmean 機能は、すべてのデバイスで共通のグラデーションにエージングされます。 pmean 機能は を彷彿とさせますnp.imply 反対側には も必要です軸名

口論。 この引数は、共有する軸を指定するためにエージングされます。 この場合、num_devices 軸ですが、この名前は完全にプレースホルダーです。任意の文字列に置き換えることができます (例: '私' また '情報' であり、これは同じように機能します)

何 pmap フードの下で行います

pmap 操作はマジカルです。情報を自動的に並列化します。 ボンネットの下で jax.pmap は を利用します) XLA (ブランドオリジナルタブで開きます) (Accelerated Linear Algebra) は、JAX が構築される線形代数演算用のドメイン固有コンパイラです。 XLA は、計算を一連の低段階の機械方向にコンパイルします。これは、基盤となるハードウェアで正常に実行されます。

XLA を使用して情報の並列処理を実行するには、jax.pmap が生成されますすべての計画を同時に処理する一連の XLA 計算。 次に、これらの計算は、通信プロトコルを使用して調整され、すべての計画がその計算を作成するための単純な情報を持っていること、およびその意味が正確にブレンドされていることがわかります。 jax.pmap が計算の先端ですべてのデバイスの出力を 1 つの変数に混合するために利用するプロトコルは、All-Minimize

All-Minimize と呼ばれます。複数のデバイスが情報を交換し、総価格を計算できるようにする分散型コンピューティングで確立された通信プロトコルです。 jax.pmap の場合、All-Minimize プロトコルは、すべてのプランからの出力を単一の出力に混合するために熟成されます。

All-Minimize プロトコルは、最初にすべてのプランでローカル合計を計算し、次にすべてのデバイス間で部分合計を交換し、すべての部分合計の国際合計を間接的に計算します。 これにより、組み合わせ価格を計算する際に、各デバイスが最新の情報にアクセスできるようになります。

つまり、jax.pmap の場合、すべての計画はそのネイティブの結果を計算し、その結果を中央サーバーに送信します。中央サーバーは、All-Minimize プロトコルを適用して組み合わせ価格を計算します。 その後、結果はすべての計画にサポートをブロードキャストし、結果のネイティブの再現を更新できます。

𝚆𝚊𝚝𝚌𝚑 𝙽𝙾𝚆 📺

Artificial intelligence, Ask HN, Networks, Show HN, Technology, TOP HN, Training Tags:Networks, Show NH:, Training

Post navigation

Previous Post: Meta が AI 言語モデル LLaMA を展開
Next Post: RealPage の安っぽい雇い上げソフトウェアを見たので、ミュートする必要はありません。

Related Posts

  • GQ.fyi (YC W21) は Rails エンジニアを採用してバイヤーが評価できるように GTP3 を作成しています
    GQ.fyi (YC W21) は Rails エンジニアを採用してバイヤーが評価できるように GTP3 を作成しています Artificial intelligence
  • レコード センターで TCP を代替する時が来ましたか?
    レコード センターで TCP を代替する時が来ましたか? Artificial intelligence
  • Yahoo が再び注目を集める
    Yahoo が再び注目を集める Artificial intelligence
  • GPT-3 を誤って実行する: 価格を 40 倍に最小化し、賑わいを 5 倍に拡大する
    GPT-3 を誤って実行する: 価格を 40 倍に最小化し、賑わいを 5 倍に拡大する Artificial intelligence
  • Uncover HN: Otterkit – .NET 用 COBOL コンパイラ
    Uncover HN: Otterkit – .NET 用 COBOL コンパイラ Artificial intelligence
  • GitHub は uncooked.github を積極的にキャッシュしており、多くの演習ケースを破っています
    GitHub は uncooked.github を積極的にキャッシュしており、多くの演習ケースを破っています aggressively
  • SimCity 2000 の実装に関するドキュメント
    SimCity 2000 の実装に関するドキュメント Artificial intelligence
  • GitHub の新規コード検索によるノウハウ
    GitHub の新規コード検索によるノウハウ Artificial intelligence
  • Bootstrapped 創業者としての私の 5 年間の 12 か月
    Bootstrapped 創業者としての私の 5 年間の 12 か月 Artificial intelligence
  • フレームワークの精神移植を備えたThinkPad 701C
    フレームワークの精神移植を備えたThinkPad 701C Artificial intelligence

Recent Posts

  • サムスンの AI 写真機能は、わずかな写真に不気味な歯を追加します
  • Hugging Face の CEO である Clem Delangue との暖炉チャット
  • Cerebras-GPT と LLaMA AI マネキンのパフォーマンス比較
  • ノーマル プルサ MK4
  • Effing-infected、Rust の仕上げライブラリ

Recent Comments

  1. robga on Excessive Avenue コーヒーのカフェイン ステージはさまざまで、テストでは
  2. Loic on 行方不明の放射性タブレットは、必死の捜索の後、WA奥地で偶然見つけました
  3. minihat on メタは、標準的な VR e スポーツ Echo Area をシャットダウンします
  4. dafelst on フレーム ポインターの巻き戻しによる Move 実行トレーサーのオーバーヘッドの削減
  5. cloudking on GraphGPT: 構造化されていないテキストの肯定的な素材からのレコードデータ グラフの外挿
  • NASA Glenn’s Females At NASA 2012 – Meg Nazario 2012-03-21T00:00:00Z
    NASA Glenn’s Females At NASA NASA
  • JDK Flight Recorder と少しの SQL を使用して Java スレッド リークを見つける
    JDK Flight Recorder と少しの SQL を使用して Java スレッド リークを見つける Artificial intelligence
  • 現在の HN: 拡張機能の VSCode のようなエディター。 コードの変更を迅速に組み立てる
    現在の HN: 拡張機能の VSCode のようなエディター。 コードの変更を迅速に組み立てる anti-Mastodon
  • 好奇心 リアハザード回避デジカム 2012-08-06 Ask HN
  • HN を示す: 簡単なサーバー側プッシュの例 Flask アプリの socketio の使用 (75 行)
    HN を示す: 簡単なサーバー側プッシュの例 Flask アプリの socketio の使用 (75 行) anti-Mastodon
  • Python が上昇を続ける理由を説明
    Python が上昇を続ける理由を説明 Artificial intelligence
  • 中国の EY クルーは、共産主義の機会にバッジを配置するように促されました
    中国の EY クルーは、共産主義の機会にバッジを配置するように促されました anti-Mastodon
  • Aibash: opeanai プロンプトで BASH シェルを強制するようにアドバイスする
    Aibash: opeanai プロンプトで BASH シェルを強制するようにアドバイスする Aibash
MAILANON
2100 MAIL
SEO
METAVERSE
BioLINK
CRYPTO MINING
CASINO
DEFI-TRACKER
StartApp Network
RAVES-MONSTER-GAME
RAVES EXCHANGE
RAVES NFT
KVANTA TV

Copyright © 2023 Nasare™🚀.

Powered by PressBook News Dark theme