
人工知能の学習は指数関数的に増加しています。 AI コンサルタントにとって、現代のあらゆるものが印刷されることを想像するのは洗練されていますが、新人にとっては、そのセットが立ち上がることを認識するのはさらに困難です。 したがって、この投稿では、私たちが厳選したアセットのリストを共有しています。現代の AI についてより賢く理解するために頼りにしてきました。 これらの論文、ブログ投稿、関数、ガイドが取得したものは、過去数年間にわたってこの分野に多大な影響を与えてきたため、私たちはこれを「AI Canon」と名付けています。 の繊細な紹介から始めます。 変成器 と 潜在拡散 オブジェクト。これが現在の AI の波を促進している可能性があります。 次に、技術的な資産の発見について詳しく説明します。 適切に構成された言語オブジェクト (LLM) を使用して構築するための目的を持ったガイド。 AI市場の分析。 最後に、トランスフォーマー オブジェクトにこの分野を紹介し、生成 AI の時代の到来を告げた Google の 2017 年の論文「Attending is All You Need」から始まるランドマーク分析結果の参考リストを網羅します。 これらの記事本当に親切な背景は必要なく、人気の AI 波の最高の物質をフラッシュするようなスピードを得ることができます。 : さらに、Karpathy からは、ChatGPT / GPT が全体的な作業にどのように反対するかについて、本当に親しみやすい合理化が示されています。それらと、研究開発がどのような方向でコンパイルする可能性があるか。 これらの資産は、深い調査の基本から AI コンサルタントによる大学レベルの機能に至るまで、機械調査と AI の初歩的なヒントの腐った理解を示しています。 LLM がどのように機能するかを明らかにしようとするアセットは無限にあり、その中には他のものよりも優れたものもあります。 ここでは、読者/視聴者の膨大な選択肢に焦点を当てて、私たちのお気に入りについて紹介します。 説明者 イラストの変圧器 図解のリアルディフュージョン: 本質的に写真用の生成 AI モデルの最も一般的な形式である潜在拡散オブジェクトの紹介。 : Chip Huyen 氏は、LLM が非常に予測可能で人間の利益になるシステムで動作するように構築できる RLHF について説明しています。 ここに、システム評価 ChatGPT の最も優れているにもかかわらず最もよく理解されていない側面の 1 つを示します。 : PC 科学者で OpenAI の共同創設者である John Shulman が、現在の主張、開発、 RLHF を使用した LLM の境界。 レッスン スタンフォード CS324 予測的発見、生理研 2016 : この初期の講演で、ヤン・ルカンは教師なしの所見について英雄的な主張をします。大規模な AI モデル アーキテクチャの不可欠な要素として活用されています。 にスキップします19:20 悪名高いケーキのたとえ話ですが、これは依然として現代の AI にとって有益な心理的オブジェクトの 1 つです。 スケーリング仮説 : LLM の基本的に最も驚くべき側面の 1 つは、スケーリング (追加のデータと計算の追加) が安定して精度の向上を維持できることです。 GPT-3 は、これを明確に明らかにした最初のモデルであり、Gwern の記事は、GPT-3 の助けを借りて直感を説明するのに大きな役割を果たしています。 : 名目上は主要な Chinchilla 論文 (以下を参照) の説明者ですが、この記事は LLM スケーリングにおける巨大な疑問の核心部分に迫ります: データを使い果たしているのか? これは上記の内容に基づいており、スケーリングのライセンス ガイドラインに関する新たな見解を提供します。 人工の汎用知能の火花: GPT-4 による初期の実験 : 人間の知能と比較した、現在最も開発された LLM である GPT-4 の機能に関する Microsoft Learn の初期分析。 AI 革命: Auto-GPT がブランドを解き放つ方法自動化と創造性の現代テクノロジー 推奨される注射: 起こり得る最悪の事態は何ですか? : 開発者向け、OpenAI API を操作するためのガイドとコード例の決定版がここにあります。 最新のコード例で継続的に更新されています。 心を見つける松ぼっくり :多くの LLM アプリは、ほぼ完全にベクトル検索パラダイムに基づいています。 松ぼっくりの心は、ブランド化されたサプライヤーの叫び声にもかかわらず、このパターンで製造する種類について本質的に最も重要な指示を与えてくれます。 : 目的を持ったコースCharles Frye、Sergey Karayev、Josh Tobin とともに LLM ベースのほぼ完全な機能を構築しました。 私たちは皆、生成 AI が何を構築できるかに驚嘆していますが、それでもなお、 生成 AI: ネクスト パーソン プラットフォーム : 生成型 AI が治療法から e コマースまでのさまざまな分野にわたる個人市場に影響を与える機会を洞察しています。 現在私たちが目にしているポジティブな AI 製品の多くは、井戸内のコンサルタントによって実行された、まったくポジティブな分析の結果です。組織化された企業と主要な大学。 現時点では、コンピューター化されたエージェントを作成したり、より小さなハードウェアのフットプリントにオブジェクトを移植したりすることで説明するために、人気のあるプロジェクトを現代的な方向に導く、フォークやオリジナルのサプライ コミュニティからの印象的な作品も検討しています。 ここでは、生成 AI について真に深く掘り下げたい人のために、これらの論文やプロジェクトの多くを詰め合わせています。 (分析論文やプロジェクトについては、付随するブログ投稿や Web サイトへのハイパーリンクも統合しました。利用可能なセットは、より高いレベルで問題を説明する傾向があります。また、通常のニュースレターも統合したので、ビデオもご覧いただけるようになりました)経時的な基礎分析を表示します。) 大規模な言語オブジェクト 注意していただければ幸いです (2018): 最初に公開された LLM の 1 つであり、現時点でも多くのバリエーションが存在します。 ( ブログをアップしました) (2018): LLM の主要な構築ルートとして発展した GPT アーキテクチャを保護する OpenAI の主要論文。 ( ブログをアップしました) ) LLaMA: 誕生と雰囲気の収益性の高い基礎言語オブジェクト モデルの改善 (例: 快適なチューニング、検索、注意) )) (2022): Imagen は、Google による AI 画像テクノロジーへの進出でした。 発表から 1 年以上が経過し、この割り当ての提出日の時点でこのモデルは一般にリリースされるまでになりました。 ( ウェブプロット) ツールフォーマー: 言語オブジェクトはツールを使い果たすように自らを教育することができます (2023): これモデルのサイズを増やすことなく精度を向上させるために、Meta でトレーニングされた LLM から外部ツール (この場合、問題点を指摘する API、Serp や計算機) を使い果たすという試みを行っています。 Auto-GPT: 自立型 GPT-4 実験 : 独自供給実験GPT-4 にさまざまなツール (Web エントリ、ファイル ストレージ、その他多数) を提供し、特定のタスクを解決するためにどれを使い果たすかを選択することで、GPT-4 の機能を強化します。 : この Python スクリプトは、(小売業者のコンテキストに対して) GPT-4 およびベクトル データベースを利用します。理解を否定し、より広範なフェアを解決する一連のプロジェクトを実行します。 その他のデータモダリティ )コード技術 AlphaCode による競合他社レベルのコード テクノロジー (2021): DeepMind によるこの分析は、人間のプログラマーよりも優れたコードを作成できるモデルを示しています。 (ブログアップしました ) ビデオテクノロジー 人間の生物学と科学データ ) 説明者) 多次元画像技術 DreamFusion: Text-to-3D、2D 拡散の利用 から生じる特定) 、 ここに記載されている見解は、AH Capital Management, LLC (「a16z」) の担当者の見解です。引用されており、もはや a16z またはその友人の見解ではありません。 ここに含まれる確かなデータは、a16z が管理するファンドのポートフォリオ企業と併せて、三次情報源から入手したものです。 一方、取る 安全であると信じられている情報源からのものであるため、a16z はそのようなデータを独自に検証しておらず、情報の永続的な正確性や特定のシナリオに対するその適切性について表明することはありません。 同様に、この叫び声の内容には 3 回目の広告が含まれる可能性があります。 a16z はそのような広告の審査をやめ、そこに含まれる宣伝的な叫び声の素材を推奨しません。 ) この叫び声の内容は情報提供のみを目的としており、おそらく真実であるとはもはや信頼されていません。 、資金調達、税金に関するアドバイス。 これらの問題については、メンテナンスアドバイザーに相談することができます。 証券またはデジタル資産への言及は機能説明のみを目的としており、資金調達に関するアドバイスや資金調達に関するアドバイス サービスや商品の提示を行うものではありません。 さらに、この叫び声の内容は、いかなる投資家や実行可能な投資家に向けられたものでも、その利用を意図したものでもありません。また、a16z が管理するファンドへの投資を決議する際に、いかなる条件にも依存しない可能性があります。 (a16z ファンドへの投資の提案は、個人の斡旋覚書、サブスクリプションの決済、およびそのようなファンドのさまざまな関連文書によってのみ行われ、その全体を読むことを希望します。) 言及されている投資またはポートフォリオ会社はすべて、言及されています。 、または説明されているものは、a16z によって管理される車両へのすべての投資のマニュアルではなくなり、その投資がヒットするかどうか、または長い涙の中で行われたさまざまな投資が関連する特性や結果を獲得できるかどうかの保証はありません。 アンドリーセン・ホロヴィッツが管理するファンドによって行われた投資のチェックリスト(公開デジタル資産への未発表の投資とともに、発行者が a16z に公開の許可を提供しなくなった投資を除く)は、https://a16z.com/ で入手できます。投資/. 内で提供されているチャートやグラフは完全に情報提供用であり、資金調達の決議を行う際にはおそらく信頼できなくなります。 過去の効率はもはや将来の結果を示すものではありません。 叫び声の内容は、示された日付の時点でのみ話されます。 これらの意見で表明された予測、推定、予想、目標、可能性、および/または意見は、のぞき見することなく交換できる領域であり、変動する可能性や、他の人が表明した意見に反する可能性があります。 追加の本人データについては、https://a16z.com/disclosures をご覧ください。
インストゥルメント 2.0 : アンドレイ カルパシーは、現代の AI の波が本当に重要である理由を (2017 年に!) はっきりと否定した最初の人物でした。 彼の主張は、AI は現代的であり、コンピューター システムをプログラムするための強力な技術であるというものです。 LLM が改善されるにつれて、この理論は先見の明があることが証明され、AI 市場がどのように発展する可能性があるかについての正確な心理モデルを提供します。
レッスン
: Chris Manning による深層学習を使用した NLP、LLM の最初のテクノロジーによって NLP の基本を保護します。 )
GPT を作成しましょう: スクラッチから、コード内で、 と綴ります: エンジニアがアクセスできるように、Karpathy は、 GPT モデル。 : Percy Liang による大規模な言語モデル、タツ・ハシモト、クリス・リーは、LLM の技術的側面と非技術的側面の巨大なオプションを保護しています。 参考と解説
参照
GPT3、LangChain、Python で強化された GitHub ボットを取得する: 人気のある LLM アプリ スタックの最も初期に公開された説明の 1 つ。 ここに記載されている主なアドバイスの一部は古いものですが、一部のシステムでは、これが現代の AI アプリの一般的な採用と実験のきっかけとなりました。
実稼働用の LLM 関数の構築: Chip Huyen は、建設における多くの主要な課題について説明しています。 LLM アプリ、それらを管理する種類、そして基本的に最も合理的な排気条件を構築する形式は何ですか。
LLM ブートキャンプ
LLM ベンチマーク
: カリフォルニア大学バークレー校のスタッフが率いる、人気のある LLM の Elo-kind ランキング マシン。 お客様は、オブジェクトの先頭からウォークまでを評価することで半分をコンパイルすることもできるでしょう。
についてはかなり多くの疑問が残っています。 それが何を企てているか
: 設定タグのフラッグシップ評価が蓄積されており、生成 AI のインフラストラクチャ、モデル、アプリケーション層で発生する可能性があります。 生成 AI プラットフォームの所有者は誰ですか?
AI コンピューティングの高いタグをナビゲートする
現代産業革命:バイオ×AI
: 人類の歴史における次の産業革命は、人工知能を活用した生物学となるでしょう。 その他の視点
GPT は GPT です: 初期の労働者適切に組織化された言語オブジェクトで実現可能な市場への影響 : OpenAI、OpenResearch、ペンシルバニア大学の研究者らによるこの論文は、「およそ米国チームの 80% は、LLM の導入によって苦労している作業プロジェクトの 10% が最終的に得られる可能性がありますが、従業員の約 19% は、プロジェクトの 50% が影響を受ける可能性さえあります。」
深い救済策: 人工知能がどのようにして人間の医療を再び構築できるか : エリック・トポル博士は、人間が作った知能が、人間のつながりに介入する時間のかかるプロジェクトから医師たちを解放する適性をどのように備えているかを明らかにします。 医師と患者の関係が回復します。 ( a16z ポッドキャスト)
珍しい物体
生成的事前コーチングによる言語理解の向上
PaLM: パスウェイを使用したスケーリング言語モデリング (2022): Google の PaLM は、数百のチップにわたって LLM をコーチングするためにブランドの最新マシンを利用し、モデル サイズとして特定のプロジェクトで予想を超える改善を実証しましたスケールアップされました。 ( ブログをアップしました
) )。 ピアも PaLM-2技術ファイル.
(2023): OpenAI の最も現代的で最も魅力的な論文であり、その詳細な内容が広く知られています。 ( ブログアップしました ))。 GPT-4 マシンカード は、OpenAI が幻覚、プライバシー、安全性、およびさまざまな問題をどのように扱うかに光を当てます。
)
)画像技術オブジェクト (2021): を紹介する論文腐ったモデル — CLIP — テキストの説明を写真にハイパーリンクします。 コンピューター ビジョンにおける基盤オブジェクトの、最初の素晴らしい、よく組織されたスケールの使用法の 1 つ。 ( )ブログをアップしました)
ゼロショット テキストから画像へのテクノロジー
(2021):ここにあるのは、DALL-E を紹介した論文です。DALL-E は、前述の CLIP と GPT-3 を組み合わせて、ほぼ完全にテキスト プロンプトに基づいて写真をロボットで生成するモデルです。 その後継となる DALL-E 2 は、2022 年に画像ベースのほぼ完全な生成型 AI ブーストを開始します。 ( ブログをアップしました
(2023): スタンフォード大学のこの論文では、潜在拡散オブジェクトを使用したオーバーイメージ技術に注目し、快適な粒度設定を実行するための現在非常に注目されているツールである ControlNet を紹介しています。 DreamBooth: フィールドプッシュ技術向けのテキストから画像への拡散オブジェクトの素晴らしいチューニング
(2022): DreamBooth は Google で開発されたコーチング用のマシンですユーザーが投稿したトピックを認識し、それらを促しのコンテキストに認識させるためのオブジェクト (例:エッフェル塔に向かって微笑む)。 (Web プロット)ブローカー
自立した機械知能に対抗するルート (2022): Meta AI リーダーでニューヨーク大学教授の Yann LeCun からの、周囲のアリーナを真に実現する自立した発光エージェントの製造に関する提案。
CodeGen: 独自のよく組織された言語モデルマルチフリッププログラム合成を使用したコード ) (2022): CodeGen は Salesforce の AI 分析部門から誕生し、コード テクノロジ向けの Replit Ghostwriter 製品をサポートします。 (ブログアップしました)
Make-A-Video: テキストをビデオに変換するテクノロジーテキストビデオデータなし (2022): テキスト プロンプトからショート ムービーを作成する Meta のモデルですが、静的な公開入力への循環も提供したり、現在のムービーのバリエーションを作成したりすることもできます。 ( ブログをアップしました ) )
Imagen Video: 拡散オブジェクトを使用した高解像度ビデオ技術
深層探索によるポテンシャルの活用によりタンパク質構築予測の向上 (2020): DeepMind のタンパク質中心のトランスフォーマー モデル、AlphaFold により、配列からタンパク質の構築を予測することを思い出せるかもしれません。これは事実上の前進であり、すでに自然のプロセスとその理解に広範囲にわたる影響を及ぼしています。病気に対する現代の治療法の増加。 ( ブログアップしました) (
)
ジュークボックス: 曲の生成モデル (2020): OpenAI は、最小限のコーチングで歌、ボーカル、歌詞を作成することに優れたトランスフォーマーの利用による歌技術への進出を実現しました。 ( ブログをアップしました )
AudioLM: オーディオ テクノロジの言語モデリング方法 (2022): AudioLM は、音声や楽器と組み合わせて、複数の形式のオーディオを生成する Google のベンチャー企業です。 ( ブログアップしました )
ジャック・ソスロー
ジェイ・ルガーニ 、
ラジコ・ラドヴァノビッチ、 と ビジェイ・パンデ この割り当てへの貢献に対して、そしてa16z のスタッフ全員が、本質的に最新の AI に関して継続的に有益なディスカッションを行っています。 の結果ソナル・チョクシ と、同社で一連の長い規範を構築してくれた暗号通貨チーム。