13 分で読める
公開日:
最終週 Kaggle は斬新な環境を立ち上げました。 異なる環境 – 多くの提案で。 これは基本的に、Abstraction and Reasoning Corpus に基づいており、Francois Chollet による 最近の論文が添付されています。 )。 この作品で Chollet は、最近の AI 研究の議題の多くの即時の到来を強調し、標準化された & 専門家による比較を可能にする 心理学的および潜在的に基本的に光沢のあるシステムの評価を主張します 。 さらに重要なことは、人間が食い尽くす全体的な知性の 実行可能な 定義を導入することです。これは、事前確率、専門知識、および一般化プロジェクトの概念に基づいています。 この定義は、進捗状況を測定し、共通の目標に共同で取り組むために、研究コミュニティによって渡されます。 論文を読んだ後、私たちの読書地区でそれについて議論します (ハイナー・スピースの
プレゼンテーションをここでチェックする場所にいる可能性が高いでしょう) また、私の心を再読することは、知的な咆哮の素材を平和的に分類することです。 だから私に従ってください、そして私はあなたに64ページのオンライン金鉱の意見のある要約を提供させてください. また、Abstraction & Reasoning Corpus Benchmark についても少し調べました。
機械学習研究の成長は、次の魅力的な可能性やゲームを探すことではありません. DeepBlue、AlphaGo、OpenAI の 5、AlphaStar はすべて、大規模な PR キャンペーンの例であり、「成功」の発表後すぐに、一般化の欠如が批判されました。 あらゆる機会に、「潜在的なボール」はさらに押し進められます…その後の驚異的なゲームへと進みます (おそらく、協力的なマルチエージェント研究の心の理論のためのハナビ?)。 それにもかかわらず、プットを中止することはできますか? すべてのゲームを解決する個別のアルゴリズムは、基本的に、より広範な人間をむさぼり食う課題に一般化することはできません。 ビデオ ゲームは人工的なサブセットにすぎず、私たちの種の生態学的ニッチ (迅速な情報生成を可能にする) の豊富なスペクトルの電子書籍ではありません。 要約すると、 知性は一連の学習能力以上のものです。 したがって、AI 研究コミュニティは、共通の目標、つまり全会一致の目標定義を決定する必要があります。
伝統的に、多かれ少なかれ重複しながら、知性を測定しようとする多くの試みがありました。 Chollet の論文は、2 つの主要な柱を検討することから始まります: 潜在能力に基づいた知能評価と潜在能力に基づいた知能評価 。 彼は、能力は光沢のある機械の真に驚異的なアウトプットであるのに対し、それらは単なるアーティファクトであると主張しています. 反対に、才能は、潜在的なアウトプットを考慮に入れるだけで、それを刺激することができます。 研究の魔法 (例えば、進化/勾配ベース、可塑性ベース、神経ダイナミクスベース) により、光沢のあるマシンは、時代遅れの情報と専門知識をブランドの斬新な主張と組み合わせるのに役立ちます。 この適応的でプロセス指向の非常に強力な条件付きルートは、おそらく知性の核心によって消滅する可能性が高いでしょう.
私には、ニッチで明示的な誘導バイアス(私たちの体や不安システムに似ている)の研究と関連する出現は、知性の核になりたいと考えています。 それはすべてのタイムスケールを橋渡しし、
無関心で、コミュニティの大多数は、長い道のりで拡散する同様のニッチな合併症に取り組んでいます一般化から飛び出し、人間が全体的な知性をむさぼり食います。 では、これについて何が達成できるのでしょうか?
AI & ML コミュニティは 前例のないユニバーサル インテリジェンス。 人間の認知と脳は、自然な最初の開始レベルを提供します。 それにもかかわらず、神経科学における発見は緩い/あいまいに見え、低段階の細胞インスピレーションを誘導バイアスのアルゴリズムモデルに変換することは全体的に明らかではありません. 心理学と心理測定学 – 心理的次元の自己規律 (基本的にウィキペディアに基づく ) – 一方、診断のさまざまな段階に関する洞察を提供します。 Chollet は、数年前から人間の知能検査を開発してきたコミュニティから得られた洞察を無視しないことを提案しています。 . 代わりに、識別されたすべての光沢のあるシステムは、その雰囲気とプロセス仕様に基づいて調整されます。 人間の知性は、人間の合併症に対して最適化されています。 そのため、火星で遭遇するであろう複雑な問題を解決するのがより困難になります。 それが、いわゆる「知性のノーフリーランチ定理」です。 したがって、私たちの知性の定義もすべて、人間の基準内の専門家にすぎません。 私たちはおそらく、擬人化された行動可能な知性の評価を無視するのではなく、代わりにそれを含めるでしょう。 心理測定の観点から、開発者のバイアスと、合成システムに生成する事前情報を明確にすることができます。 Chollet は、人間中心の知性のテストを作成することを提案しています。このテストには、人間の認知的先験的知識とコア情報 の発達心理学の考え方が組み込まれています。 これらは、生まれつきの能力 (例: 古典的な幾何学、算術、物理学 & エージェンシー) に加えて、説明のさまざまな段階 (例: 低段階の感覚運動反射、高段階の情報以外に教えられる勉強の柔軟性) を含みます。 知能の実行可能な定義は、次のようになります:
「機械の知性は、事前知識、専門知識、および一般化プロジェクトに関するタスクの範囲にわたる潜在的な獲得効率の尺度です。」 – ショレ (2019; p.27)
さらに、Chollet は適切なアルゴリズム情報理論に基づいた人工機械の知能の尺度を提供します:
つまり、知性の尺度は、最近の情報の悲鳴と、危険な未来をはるかに下回る柔軟性との間の変換率として解釈されます。 仕事の一般化プロジェクト、事前情報、専門知識を考慮し、関心のあるタスクの主観的な構築としてだけでなく、プロセスの主観的な重み付けを可能にします。 この尺度は、提示されたプロセス範囲 (生態学的ニッチ) に結び付けられ、能力を単なるアウトプット アーティファクト プロパティとして扱い、カリキュラムの最適化に基づいています。 ハイステージでは、この測定はハイダウンの最適化目標を定義するのに通用します。 これにより、いくつかの連鎖律/自動微分魔法 (以前は生命が簡単に微分可能であった場合) をコンピューターでスクリーニングし、最も重要なこととして、進歩を定量化することができます。 それは専門知識以外の事前情報の量にペナルティを課し、それによって上記の原則に従います.寸法?
抽象化と推論コーパスは、再現可能なチェックを評価して提供することを目的とした新しいベンチマークを導入することで、このクエリに対処します。合成知能。 これは、古典的なレイヴンのプログレッシブ マトリックスに敬意を表しており、かなり要求が厳しい場合には、人間にとってもうまくいく可能性があります。 各プロセス (上記のインスタンスにつまずく) は、マシンにインスタンスの入力と出力のペアの苦境を与え、チェック入力の出力を照会します。 マシンは 1 対の戦略を立てることができ、バイナリ報酬シグナル (適切/誤謬) を受け取ります。 上記の義務の明示的な解決には、重力の概念のおおよその概念が必要です。 出力は、単にオブジェクトを画像配列の下側に「ドロップ」するだけです。 それにもかかわらず、これは単一の解決例にすぎません。 ベンチマークはより広く、コア情報の異なる概念を必要とします。 全体のデータセットは、400 の演習タスク、400 のレビュー タスク、および 1 つの他の 200 の占有チェック タスクで構成されます。
最後の数日間は、実を言うとベンチマークで指がかなり汚れていました。 シャッフル アンド プレイのディープ (強化) スタディを使用しようとすると、多くの古典的な複雑な問題が発生します。 最初のトピックは、不規則な入出力形状 にあります。 お気に入りの MNIST-CNN を練習する機会に、入力層と出力層の両方の形状が固定されます (つまり、32×32 と 10 個の出力桁ラベル)。 その意味で、ARC ベンチマークは頻繁に行われることはありません。 何度も何度も、さまざまな形式の 2 つの例があり、出力クエリには異なるものがあります。 これにより、単一の入出力層を持つネットワーク を実践するつもりはほとんどありません。 さらに、一連の例はさまざまで(以下の解決につまずく)、3つが努力するレバレッジは長い道のりです. 私の最初のヒントは、与えられた例で適切な倍数の腐った検証トレーニングを作成し、リレーショナル DL コミュニティからのヒントを活用するように努力することです (例: PrediNet)。 2 つで準備し、最後のインスタンスで確認します。 理想的な収束後、腐った検証エラーがゼロになると、有効なチェック ケースに進みます。 原則的な環境: すべてのインスタンスでのオンライン トレーニング。 これは、場合によってはかなりの計算負荷に発展する可能性があります.
努力を活用するための方法論を考慮に入れることは、メタ強化の学習目標を作成することになります。 これにより、即時の適応も可能になります。 したがって、オラクルとの 3 つのクローズド ループ インタラクション内で効率を最適化します。 これは、RL^2 LSTM は、古いものを入力として、提案を試みます。 以下は、さらに詳しい環境の洞察のペアです:
ピクセル光沢のある MSE 損失を最小限に抑えることは、基本的に制限されています。 解像度のレビューでは、半分不快なことはおそらくないので、わずかな MSE 損失でも不快な出力につながります。
ショレ自身が
- と呼ばれるフィールドに正確に飛び込むことを提案していますプログラム合成
追伸: このトピックは 3 か月続きます。 % %item_read_more_button%%