TLDR; AI ユーティリティ ChatGPT を使用した最新の支出ケースの急増の中で、さまざまな AI システムで拡張機能を作成することが可能であり、古いものであるかどうかをテストします。 私たちは AI のモダリティにおける賢明な苦境でそれを見て、それによってそれが教育を受けていない、ラップトップのビジョンに変化し、結果を記録します。 中程度のChatGPTの推奨事項は、純粋にレコード中心のメトリクスプッシュスキルを使用して、ランダムサンプルよりも中程度の10.1%の精度の向上と34.4%の購入の向上を達成します. 投稿のコードは ここにあります.
一般大衆の想像力を閃光のようにはっきりと捉えた技術的傾向はほとんどありません。 OpenAIによるChatGPTの解放。
発足から 2 か月以内に、1 億人以上の顧客を獲得し、最速の公共事業 そのように歴史的な過去に由来します。 多くの人が ChatGPT を技術的に急上昇していると考えていますが、その正確なスパーク は劇的な技術的ステップ スワップ ( に従ってではありませんでした GPT3、それに準拠したマネキンは 3 年近く使用されています)、しかし実際には異なる点として、完全に調整された AI ユーティリティに変更されました。特定の人物と人間の相互作用の方向性。ひょっとすると、一般大衆を完全に畏怖させる正確な世界の支払いを想像できるマシン。 AI の形態は、承認された生活のさまざまな部分で開示されますが、バックグラウンドでは大部分が隠されています (Google 検索、YouTube の推奨事項、迷惑メール フィルター、ID 認識)。
ChatGPT は、露骨に 人工的ですが、さらに光り輝く数少ないものの 1 つです。 脚光を浴びている AI は、思考の断片、記事、映画、ブログ投稿、およびポッドキャストの大洪水を生み出しました。
この主張の中で、AI モデルのより興味深い意味合いによって、すべての方法について質問と考察が更新され、次の方向に進みます AI意識、伝統的人工知能(AGI) )、および
技術的特異点。 基本的に最も投機的な出来事では、アラーム (またはあなたが誰に質問するかを見て期待) は、私たちのファッションの洗練、活力、および複雑さが、ブレイクアウェイ インテリジェンスのイベントの地平線を破り続けることです。コア効率と自己強化するサルベージ能力の両方を自己強化します。 これは、私たちが鋭く意識しているように、社会と人間の存在の認識不可能で不可逆的な移行に拍車をかける、指数関数的に成長する明らかな強化サイクルを構築する可能性があります.
未定…それは今の私たちのアタッチメントではありません.
ChatGPT は現在、ターミネーターの朝の時間ではありません. 迅速なモデルで穏やかなスキルのルートを予測することは、多くの場合愚かであり、そのより広い意味ではより重要です。 それにもかかわらず、明確に迫り来る答えのない頼りがある場合、私たちはより小さく、より魅力的なものに尋ねることで、洞察と直感を穏やかに作り出すことができます.
その意味では、私たちが提起できるより単純な計算がわかり、この真実のために、AIの自己強化に関して見てみましょう:
1 つの AI マシンが他の 1 つの AI マシンを反復的に強化できるかどうかを垣間見ることができる道を発見できますか?
AI の進歩の当面の主なエージェントは、エンジニアや研究者として機械研究に取り組んでいる他の人々であると考えています。 ラディアント プロキシのサブカウントは、次のようになります。
If ChatGPT は ML エンジニアとして調整することです。調整に伴うタスクのリストをまとめるのが最も効率的です。 ML エンジニアの日常生活には、ハンドブックの閲覧と情報の探索ファッションの指導とマネキンの結果の評価
マネキンの配置とマネキンの監視プロセスの管理.カスタマイズされたアルゴリズムとスクリプトを作成します。
整理をまとめて結ぶ糸は、機械学習技術者が多才な技術的苦境解決者でなければならないという真実です。 したがって、ChatGPT の ML タスクの幅広い範囲で作業する以外に、アレンジメントのより要約的で芸術的な苦境を解決する部分に関心を向けることができます。
ChatGPT を使用することで、いくつかの推奨事項で範囲を狭めることができます:
特にラップトップ ビジョンのモダリティで動作します:私たちがラップトップ ビジョンを選択したのは、それが私たちのスキルであり、きれいな言語のマネキンである ChatGPT が (私たちが知る限り) トレーニング ジョブで目に見えるメディアへの入場許可を得ることができなかったからです。 このように、純粋に概念的なレベルからこの分野にアプローチします.
具体的なおもちゃの苦境を乗り越える理由:誰もが知っていて争っている Python ライブラリと、私たちが知っていて争っている絶滅危惧種の動物の両方に敬意を表して、パンダ の頑丈なオブジェクト検出器を構築するというおもちゃの苦境に勝ちました。 最初に提供された YouTube-VOS データセット からレコードを拡張できます。
明示的に記録中心のスキルを購入する: コツをつかむ レコード中心の 方法論は、通常、放射マネキン モデルに最適なレバレッジの 1 つを発見するためです。 私たちは、トレーニングのためにマネキンに入力されるレコードとラベルを改善することにもっと関心を持つことができるように、マネキンとパラメーターの選択の複雑さの主要部分を取り除く立場にあります. ハイパー パラメーターとマネキン アーキテクチャによって動作する、よりマネキン中心のスキルを使用すると、主要なスキルとは対照的に、ChatGPT から要約推論能力をチェックすることがはるかに少なくなります。 最近のツールを使用する: 義務をさらに簡素化するために、ML エンジニアが通常自分で作成する内部ツールに依存しています。 ChatGPT は (残念ながら) Jupyter Notebook で時間を費やすことができません。 Encord プラットフォームを活用して、Encord の マイクロファッション および稼働記録、支払い、およびマネキンのレビューを提供ツール Encord Active。 マネキン トレーニングを実行するためのコードを以下に示します。
この狭い範囲の思考で、私たちのスキルは、ChatGPTを使ってカスタマイズされた書き込みを作成することですEncord Active による品質メトリクス により、パンダの苦境でレコード、ラベル、およびマネキンの予測を絞り込み、レコードを整理することができます。
高品質の指標 は、レコード、レーベル、ファッションをさらにパラメータ化したものです。 これらは、意味的に関与し、接続された推奨事項でトレーニング レコードと予測をインデックス化する推奨事項です。 例には、画像のぼやけを重視するより伝統的な属性から、画像内の歩行者間の適度な距離の必要性を重視する任意の特定の属性まで、あらゆるものが含まれます。
ChatGPT の仕事として私たちの ML エンジニアは、下流のマネキンの効率を改善する目的で、ラベルとレコードを台無しにしてキュレートするための推奨事項を思いつくように動機付けを行う必要があります。
この単純なメトリックは、ティーチ率を計算しますレコード住居内のバウンディング ボックス の。 このメトリクスを使用してデータセットをトラバースすると、レコードを台無しにする 1 つの方法が予測されます:
ChatGPT の取り決めは、記録を強化するために使用できるさまざまな接続されたメトリックを検索することです。 .
さらに気を付けなければならないレベルは、ChatGPT が ML エンジニアとして非常に不利であるということです。 それが対処しているレコードをまっすぐに考えることはありません。 その実装能力はさらに制限されています。 残りの部分では、ChatGPT はサルベージの成功の犠牲者として、頻繁に機能停止と無応答を繰り返しています。 ChatGPT はあなたの会社の ML エンジニアで、非常に忌まわしい Wi-Fi を備えた不毛の島に住んでいます。基本的に彼らが製材する最も効率的なツールは Slack です。 したがって、輝かしい理由から、ループ内の人間のスキルが必要です。 私たちは、ChatGPT の目、耳、指として、この任務を遂行している同僚たちと同様に支援することができます.
上記の制約がある場合、私たちのアプローチは次のようになります: 最初のベンチマークを調整するランダムにサンプリングされたレコードのマネキンChatGPT にアイデアをリクエストレコードと支払いの選択ジョブを強化するために を含むカスタマイズされた品質メトリクスを記述して、これらの推奨事項をインスタンス化します 改善されたレコードで新しいファッションを教育する購入を検討ファッションとレビュー
情報中心のスキルにより、ChatGPT が実験する必要のある変数を適切な品質指標に制限することができます。 すべてのファッションとハイパーパラメータがライブマウントされます。 要約すると:
今、私たちが人間としてぶらぶらしている贅沢の 1 つは、OpenAI サーバーに閉じ込められたニューラル コミュニティに対して (今のところ)、記録。 いくつかの穏やかな目に見える検査により、(私たちが意図的に開始した) 支払いエラーを一目で確認するのはそれほど複雑ではありません。 この仕事を通じて、私たちはChatGPTに対応するための適切なコンテキストを提供するために、ChatGPTに予測するものと同じくらい主要な通信を維持するために最も効果的なものを発信する立場にあります. いくつかの (議論の余地のないかわいい) レコードの例は次のとおりです。
これらすべてが確立されたので、ChatGPT の取り組みをベンチマークする最初のマネキンを作成することで開始できます。 私たちのベンチマークでは、住居の教育記録の 25% の無作為抽出サンプルを処理し、上記のマネキン トレーニング ループによってそれを処理します。 私たちの最初の結果は、0.595 の中程度の精度 (mAP) の中央値になり、0.629 の中程度の購入を意味します.
私たちは今までの立場にあります次にバインドするアタッチについては、out ChatGPT を参照してください。
ChatGPT は機械学習を行います
私たちのベンチマーク住居では、品質指標でデータセットを強化するための推奨事項について、ChatGPT で盗みます。 私たちの最初のスキルは、苦境について大まかに説明し、最初の推奨事項を引き出すことです。
一連の動機付けと前進により、ある程度生産的なブレインストーミング セッションが得られます:
もう、今はぶら下がっているので メトリクスの魅力的な推奨事項。 推奨事項をドラッグし続けるために、不幸な健康状態で運命的にワードルを台無しにしようとする試みを含む、一連の複数の長い会話についてチャットします.
多くの対話 (および正確な信頼関係が構築された後) の後、ChatGPT が思いついたサンプル指標の推奨事項をまとめることができます:
Object Proximity: 体格内のパンダのバウンディング ボックス間の頻繁な距離をパラメータ化します。 これは、パンダがそれぞれに非常に複雑である場合、チャンスごとに貴重である可能性があり、オブジェクト検出マネキンを混乱させる可能性があります. オブジェクトの自己信念の取得: これは、最近のマネキンを使用して、最初のマネキン自体でコストの自己認識段階を嘆かわしくする古風なスキルです.
オブジェクト数: 体格にパンダを付ける必要性がマネキンの精度に影響する場合に関連する単純なメトリック.
Bounding Field Tightness: 球自体の問題比率からの境界フィールド内部の等高線の問題比率の偏差を計算して、球がすべてにぴったり合っているかどうかを測定します。気になる記事による方法
メトリクスの推奨事項に加えて、どのように支出させるための推奨事項を決定します
メトリクスを使用してレコードの品質を向上させることについて ChatGPT がどう考えているかクイズを出してみましょう.
また、メトリクスが疑いのない支払いエラーを袋に入れている場合に、何を発信するかについても期待できる立場にあります.
要約すると、ChatGPT に従ってマネキンを改善するためのいくつかの具体的な推奨事項は次のとおりです:
レコードデータの階層化: メトリックを使用してデータセットを階層化してバランスをとっています
これで、ChatGPT のアイデアによる実用的な指標と推奨事項の必要性がまとめられました。 次のカウントは次のとおりです:
ChatGPT は、これらのソリューションを実際に実装できますか?
次のステップは、サルベージのカスタマイズされたメトリクスとして推奨事項をインスタンス化することです。 サンプル メトリック コードと Encord Active の指示 を入力して試してみましょう。 ドキュメント メトリックの例:
下から見ると忠実に見えます。 私たちはChatGPTが促したさまざまなメトリックスを使いこなし、複製/貼り付けによって試すことができる、もっともらしく見える同じコードスニペットを袋に入れます. これらのメトリクスを Encord Active に差し込んで、どれだけうまく動作するかを考えてみましょう:
尊敬してるここではいくつかのエンチャントが不可欠です。 ひょっとしてこれが何に由来するのかChatGPTでクイズしてみましょう
ええとああ. 複数の更新に関係なく、妨害された応答が明らかになります。 信頼できない同僚を賞賛してください。ChatGPT はバグのあるコードを書き、その日は無反応でログアウトしていました。 . かなりの量のハンドブックのデバッグを行った後、私たちはついに ChatGPT のメトリクスを手に入れました。 私たちは今、動機付けを行い、その推奨事項を実行する立場にあります.
他の記録科学イニシアチブと同様に、秘訣は、候補となる推奨事項を何度も繰り返すことです。 複数の ChatGPT メトリクスを使用して結果を緩和することはできますが、簡潔にするために、それが促したフィルタリング アプローチを最も簡単に試すことができます。 私たちは ChatGPT がこれらの実験を行うことを避け、このレベルまで作業を行った後に緩和させます。 いくつかの実験と ChatGPT メトリクスのサンプル コードを Colab ノートブック ここ に割り当てています 。
ChatGPT の指標と推奨事項を使用して、複数の実験を行いました。 ChatGPT のマネキンの効率を下に考えることができるメトリックを試してみます.
ChatGPT メトリクスの推奨値を超える適度な値は、純粋にレコード中心のメトリクス プッシュ スキルを使用して、ランダム サンプルよりも中程度の精度で 10.1% の向上、購入で 34.4% の向上を達成します。
今では真に最高の同僚ではありませんが、ChatGPT はもっともらしい指標を考え出す上で称賛に値する仕事をしました。 その推奨事項は、パンダ検出器でよく知られている強化を行いました。 ChatGPT は次の Geofrey Hinton ですか?
もはや正確には違います。 1 つには、そのコードは製材に人間の多大な介入を必要としました。 さらに、一般的な対話の仕事の背景には、健全な量の人間の判断が暗黙のうちに注入されていたという観察を省略することはできません。 実を言うと、私たちの最も勝利した指標は、支払いエラーを減らし、マネキンの効率を改善することで基本的に最もよく知られている印象を持った実際の個人が、人間のアドバイスに大きく影響されました:
この「境界フィールドの厳しさ」メトリックは、初期に定義され、一連のプロンプトと応答で到達するように変更されました。 メトリクスへの道は、ChatGPT によって刻まれたものではなく、人間の手によって刻まれるようになりました。
ChatGPT はさらに、いくつかの単純な苦境、特定の指標の機会を逃しました。 パンダについての人間の明白な観察は、その黒と白の色です。 支払いエラーのために試行されたハングする直接的な測定基準は、白と暗い境界フィールド ピクセルの必要性を、球内のピクセルの一般的な必要性で割ったものです。 このメトリックの数値が低い場合、境界フィールドがパンダをしっかりとカプセル化していない可能性があります。 私たちには明らかですが、私たちの最も効率的な努力にもかかわらず、これを受け入れることはおそらくできません.
全体として、ChatGPT はラップトップのビジョンを非常によく実現しているようです。 固有のトラブルやフレームワークに対する貴重な推奨事項と初期テンプレート コード スニペットを生成する立場に変わりました。 そのおかげで、私たちはパンダ検出器をかなり強化できる立場にありました。コード テンプレートを作成する機能は、すべてをゼロから作成する必要があるだけでなく、(人間の) ML エンジニアの反復サイクルを非常に長くする可能性があります。
欠けていたところは、何度も何度も何度も何度も何度も何度も何度も、ガイダンスなしで古い推奨事項と結論を救い出す能力に変わりました。 焦点を絞った推論によって、苦境の特異性を深く掘り下げることはありませんでした.旅と、以前は苦労して戦ったさまざまな洞察。 ChatGPT はまだハングしていないように見えますが、この機能を開発したのは、「せっかちなエンジニア」のルートを穏やかに頼りにすることです。 可能性としては、機械学習の推奨事項と推奨事項の正確な開始レベルになる可能性がありますが、独立した ML エンジニアリングの認知スキルの深さにはまだかかっていません。
ChatGPT は、AI マシンを強化するために古代から使用できますか? はい。
次のスタンドアロン ML エンジニアとして採用しますか? いや
GPT4まで待とう
その間の長さで、 Encord Active 自分自身を想像するために d を盗みます GitHub と、ChatGPT を使用してサルベージ データセットを強化する方法について質問があるフォギーには、
でクイズを出してください。 Slack チャンネル。