AI ファイター パイロットが Protection Evolved Compare Initiatives Agency の AlphaDogfight 競合他社 内で熟練した人間のパイロットを 15 対 0 で破ったとき、それは人間よりもうまく浮くことができませんでした。 そうでなければ戦った。 Heron Programs の AI エージェントは、2 機の飛行機が 1 対 1 で対決していたときに、前方への銃声を作り出しました。 ある戦闘機パイロットは、AI の能力を「超人的能力 」と表現し、人々にとっては「ほとんど見えなくなった」非常に正確な、一瞬の射撃を行いました。 さらに印象的なのは、AI プロットがこのデバイスと戦うようにプログラムされていないことです。 それは、この戦術を完全に実現しました。 AIプログラムのスキルは、人々よりもはるかに優れていますが、それ以外の方法で戦うことは、一見重要な戦いの収入です。
AI の利点を活用することでおそらく最も利益を上げているかもしれない軍隊は、AI の独特で一般的に異質な種類の認識を効果的に発見して消費する軍隊である可能性があります。 米国の保護イニシアチブは、 AI プログラム を チームメイト を称賛する運用として考えています。 ) または コパイロット 。 しかし、AI プログラムは一般に、非常に多様な方法で人々を判断します。 これらのバリエーションは収益になる可能性がありますが、戦闘員が AI の独特の非人道的な長所と短所を発見した場合、最も注目を集めることになります。 米軍は、AI プログラムを使用したプロトタイピング、実験、およびウォーゲームへの投資を黙って増幅し、戦闘中のように見えるものと、最も注目を集める方法についての概念をよりよく発見する必要があります.
ゲームでの AI のパフォーマンスは、戦闘での一見有利な点と、その先にあるかもしれない型にはまらない調整についての教訓を示しています。 AlphaGo が中国のテクニック スポーツ ウォーク で李世ドルに勝利したことはよく知られていますが、あまりにも臆病なリーは、机から立ち上がって部屋を出て行った。 AlphaGo は、 人間がそのモセを (3,000 万人の教育を受けた人間のストライキのデータベースによると) 楽しむパーセンテージを 1/2 として計算しました。 10,000。 AlphaGo の mosey はそれほど良いものではありませんでした。
AlphaGoのイレギュラーなモジモジはまぐれではありませんでした。 AlphaGo は、さまざまな方法で人々とは異なる パフォーマンスを発揮します。 これにより、ボードのさまざまな部分で2つの同時攻撃を実行できますが、人間のゲーマーは1つのジャムを形成する傾向があります. そして、AlphaGo は ユニークなオープニング ストライク を開発しました。 人々は単に一時停止するだけで、もはや発見することはありません。 AlphaGo のエンジョイ モデルを観察するコンサルタントは、それを「エイリアン」であり、「他のあらゆる次元から」と報告しています。 ポーカーで超人的なパフォーマンスを発揮した AI プロット Libratus は、教育を受けた人間のゲーマーとは異なるパフォーマンスを示します。 それは、人間のゲーマーよりも効果的に賭けの戦術を調整し、ポットのサイズの 20 倍の場合でも、非常に小さく、または非常に巨大な賭けを行います。 「それは賭けを3つ、4つ、5つのさまざまなサイズに分割します」ダニエル・マコーレー(Libratusに置き忘れた人)アドバイス ワイヤード 雑誌。 「それをすべてやり遂げる柔軟性を持った人間はいません。」
チェスのグランドマスターは、チェスを楽しむ AI エージェント AlphaZero の打撃をじっくりと観察し、その独特の楽しみ方を調べます。 AlphaZeroは、人間のゲームからのデータなしで、セルフプレイによってチェスを完全にプレイすることを実現しました。 チェスのコンサルタントによると、それは対戦相手のキングに対して「凶暴で驚くべき攻撃」を行います。 長い衝動の中でより多くの推奨事項を提供するストライキを強く支持します。 これにより、 チェス デバイス を早期に犠牲にして長期的な収益を得ることができます。ただし、敵の王を攻撃するための元の位置に成功する必要があります。 機動性と攻撃の組み合わせに特に優れており、両方を活用することは、おそらく人々が複製するのに最適です.
ゲームでの AI ブローカーの優位性は、戦闘中のように見えるものの一部を示しています。 ゲームの AI ブローカーは、人間のゲーマーと並べると、驚くべき正確さ、衝動、調整、状況認識、便利なリソース管理、攻撃性、惨めさを示します。 ゲームにおけるこれらの利点の累積的な上昇は、人間の対戦相手にとって壊滅的です。 これらの属性は戦闘においてさらに貴重です。 ただし、AI ブローカーには弱点があります。 それらのパフォーマンスは一般的に非常に脆弱であり、AI ブローカーはゲームのラント ルールの調整に適応するために戦うことができます。 これらの弱点は、戦闘ではおそらく致命的であるとささやくかもしれません—原則のようには見えません—そして軍隊はAIプログラムの欠陥を黙って心に留めておく必要があります.
StarCraft IIなどのコンピュータ ゲーム) と Dota 2 は、AI パフォーマンスの貴重な試練の場です。 これらのゲームは、領土と資源の監視を守るための戦いで相反する側面を突き合わせ、すべてのプレーヤーがデバイスに挑戦してデジタル戦場を回り、偵察、便利な資源収集、および戦いに耐えます。 正確な世界よりもはるかに複雑ではありませんが、これらのゲームは他のゲームに比べて非常に複雑です。 StarCraft II
の任意のレベルで
約10件あります26 プレイヤーが収集できるアクション。 いくつかのレコードデータが隠されているという話では、ゲーマーは、膨大なデータを使用して動的かつ継続的に変化する環境で集合的に作業します。 さらに、コンピューター技術のゲームでは、ブローカーは永続的ではない戦術と長期的な計画のバランスを取る必要があります。 Dota 2
には、プレーヤーがモージーを作成できる時間ステップが約 20,000 あります。これは、チェスの 1 スポーツあたり約 80 回のストライクまたはチェスの 1 スポーツあたりの 150 回のストライクよりもはるかに長くなります。 歩く.
AIブローカーは素晴らしい 報告と保護監視 を通じて PC テクニック ゲームを楽しんでいます。 AI ゲーマーは、人間のゲーマーと同じ記録データ、リソース、およびデバイスへのアクセスを楽しんでいます。 彼らの特定の個々のデバイスは、同じ衝動と能力を楽しんでいます。 すべての収益は、記録データのパス、意思決定の捏造、アクションの収集に対する AI ブローカーのスキルに起因します。 AI ブローカーの勝利は、マシンがレポートで人々よりも劇的に優れていることを示しており、戦いで一見重要な収入である見張りを守ることができます.彼らがチップよりもはるかに速くできる立場にあると仮定します正当な人間のゲーマー。 制約を受けないままにしておくと、AI ブローカーは事実上 ラント単位の戦術では無敵 になります。 PCゲームで敵の攻撃をかわす準備ができています。 人間の衝動にとらわれない場合でも、AI ブローカーはユニット戦術に長けています。 さらに、2 つのプロジェクトに注意を分散するよりも、より多くのレコードデータを同時に吸収できます。 それらはより適切であり、貴重な行動、時間、またはリソースを浪費することから保護します. さらに、AI ブローカーは 2 つのペアの間でより適切な調整 を使用して攻撃することができます。デバイスまたは 共同ブローカー.
OpenAI の Dota 2 ブローカー、OpenAI 5 、これらの属性の多くを示しました。 彼らは、人間のプレイヤーを攻撃し、衝動的に カウンター する準備ができていました。 彼ら 人間のゲーマーよりも速いかもしれない人間の応答インスタンスを比較することになっている 200 ミリ秒の遅延で動作している場合でも、反応する可能性があります。 さまざまな AI ゲーマーによって制御される個別のチームの貢献者である OpenAI のブローカーは、攻撃を正確に調整する準備ができていました。 彼らの衝動、正確さ、協調性により、彼らは特にチームで優れた成果を上げました2 人のブローカーが協力してさまざまな相手と戦うファイト 。 さらに、ボットは人間のゲーマーと比較して不規則な攻撃性を示し、継続的に攻撃を行いました。 ある人間のプレーヤーは、次のように語っています。 歩く, ポーカー, )StarCraft II、または Dota 2 正確な世界の戦いには翻訳されませんが、AI の超人的な衝動、認識、正確さ、協調性、計算された惨めさを取ること、攻撃性は、おそらく非常に正確に、戦いにおいて非常に貴重である可能性があります. AI ブローカーが PC ゲームで楽しんでいるのと同じように、レポートを収集して監視機能を保護するようにアルゴリズムを教育した軍隊は、競争相手を意気消沈させ、無力にする可能性があります.
歩行と強制エラーの増加
2 種類のゲームの中で、人間に対する AI の一見有利な点について、いくつかのよくあるパターンが浮かび上がってきます。 原則はおそらく最も明白です: 記録データ処理の衝動と規模の増大です。 チェスでは、人間のグランドマスターがAlphaZero の攻撃よりも 15 ~ 20 回先の最も注目を集める攻撃について教えてくれました 毎秒60,000ポジション. 一瞬のタイミングが問題となるドッグファイトでは、AI エージェントは、人間の認知や反射の遅さに悩まされることはありません。
AI ブローカーは、人間よりも迅速かつ正確に相手を追跡できます。 正確な時間の PC テクニック ゲームでは、AI ブローカーは、一対の同時アクションを含め、人々よりも速くプロジェクトを一時停止できます。スポーツのトレーニング。 StarCraft II または Dota 2、AI エージェントは、人間が行うように、戦いが繰り広げられているプロットの 1 つのフェーズに注意を集中させたくありません。 . すべてのプロットに関する事実を同時に吸収します。 これにより、AI ブローカーは、すべての動きに対する方向性と認識が向上し、リソースに最適な優先順位を付ける柔軟性が得られます。 さらに、AI ブローカーは、明確な瞬間に競争相手に遠回しに関与する可能性があるスポーツの部分に注意を払っています。 チェスを楽しむエージェントである AlphaZero と、StarCraft II である AlphaStar はそれぞれ、楽しんでいます。エージェント、エンジョイは、最初に攻撃される前に攻撃を試みるよりも、攻撃後にもはや望んでいないように見えるデバイスを再展開する習慣を示しました.
超人的な注意力の AI ブローカーは、自分のスキルを発揮して不注意なフォームを作成することはありません 教育を受けた人間の遊びでさえ報告する大失敗。 ほぼ完璧にプレイするスキルは、場合によっては想像を絶するかもしれないという議論の余地のない真実にもかかわらず、多くのゲームで巨大な収益になる可能性があります. AlphaStar との対戦を楽しんだ後、正当な StarCraft II プレイヤー Grzegorz “MaNa” Komincz 注、「私は自分のゲームプレイがどれだけ素晴らしいものであるかは、強制的なミスと、人間の反応を受け入れる準備ができているかどうかにかかっていることに気づきました。」 不注意なミスを防ぐだけでも、AI ブローカーにとって重要な収益になる可能性があります。ドッグファイトでの前哨戦の銃声や、
さらに、AIブローカーは、調整と長期計画において、人々よりも重要な利点を享受しているようです. チェスでは、AlphaZero は 2 つの攻撃を組み合わせることに長けています。 Dota 2 では、AI ブローカーは、マルチキャラクターの攻撃ですが、戦略的な行動でも。 Dota 2 を楽しむとき、人間のゲーマーはチームメイトの間でプロットを分割する傾向があります。ゲーマーの最も注目を集めるスイッチング位置は、今でも何度もありました。 OpenAI 5 の 5 人の AI ブローカーは、ゲームの進行に合わせてチームとして柔軟に調整し、人間のゲーマーよりも一般的にプロット上のキャラクターの位置を切り替えました。 ポーカー、walk、チェスでは、AI ブローカーが古いように見えるストライクを作成します。ミューズ、しかし、彼らは長期的な位置収入を得ることができます. それでも、この収益は常に目新しいものではなく、人間の観察者は時々楽しんでいます AI ブローカー の自明な を批判しました。 長期計画の欠如
.
多くのゲームを通じて、AIブローカーは楽しんでいます利用可能なアタッチメントを広げました戦術や戦略など、人間のゲーマーとは異なる行動をよりよく示します。 チェスと 散歩 を楽しむブローカーの急進的な戦略は、一般的に注目を集めています。 、ポーカーや PC ゲームを含む他のゲームでも同じ動作が見られました。 正当な StarCraft II プレイヤーの Dario “TLO” Wünsch は、AlphaStar について次のように述べています。これまで考えたこともなかった戦略であり、まだ完全には探求されていない新しいスポーツの楽しみ方がひょっとするとあるかもしれません。」 場合によっては、予測不可能性が重要な収益となるポーカーのように、この変動性の上昇がそのまま収益につながることもあります。 他の例では、人々がこのスポーツの物語をどのように捉えるかを拡大しました。たとえば、チェスでは、AlphaZero が人間のグランドマスターに新しい穴を検出させました.
AI ブローカーは楽しんでいるようです.人間のゲーマーとは異なる可能性があり、場合によっては、人間のゲーマーが比較することはないように見える方法で、戦略の劇的な変化と惨めさを取ることを望む柔軟性。 ポーカーでは、Libratus は推測サイズのワイルド シフトを作成できます。 walk では、AlphaGo が収益を得るとすぐに保守的に実行されます。他のプレーヤーに対する勝利のマージンよりもわずかに成功する可能性を最大化するように設計されたマイル。 AlphaGoが先なら 保守的にプレイして、差を広げるためにプレスするよりかろうじて、おそらくわずかなマージンである可能性があるものをロックします。 しかし、AI ブローカーは常に慎重にプレーしているわけではありません。 チェスでは、AlphaZero はスポーツの早い段階でデバイスを犠牲にし、悲惨さを長期的な収益のために犠牲にします。 Dota 2 では、OpenAI 5 ブローカーが積極的にプレイし、人間のゲーマーに絶え間ないストレスを与えています。そして一瞬たりともあきらめない。 これらのブローカーは、人間のゲーマーよりもさらに細かく調整された惨めさを求める柔軟性を楽しんでおり、実証されています. OpenAI の研究者 の指摘 :
人間ゲーマーは一般的に、ヒーローの存在が低い場合は慎重です。 OpenAI 5 は、低レベルのヒーローによる積極的な攻撃が惨めな結果になったときに、非常に細かく調整された考えを楽しむかのように見えました.
AI ブローカーの一時停止もはや、流行に乗って、人々よりも積極的または保守的にプレーしているようには見えません。 適度に、彼らはより戦略的で合理的な能力でプレーしているように見えます(おそらく冷血に指示するかもしれません)、攻撃性の卒業証書を調整したり、秒内で名前が付けられているものに警告したりします. 人間のプレイヤーは、保守的または攻撃的なプレイに反対する傾向を望んでいるかもしれませんが、AI ブローカーは、手順に到達するための最高の方法に従って、両方の極端を実行し、それらの間を急いでピボットする立場にあるようです.
AI ブローカーはもはや完璧ではありません。 彼らの弱点のテーマも頻繁にあります。 彼らのパフォーマンスは、チェスや ウォーク などの一部のゲームの人々にとっては単に素晴らしいものですが、正確な時間の pc テクニック ゲームの場合、最初に終了した環境は、いくつかの障害を穏やかにもたらします。 一貫した弱点の 1 つは、AI ブローカーが StarCraft II と を楽しんでいることです。 Dota 2 は、ラント単位の戦術における利点に密接に依存しているように見えます。期間計画。 さまざまなシナリオの AI プログラムは、概して、次善の戦略を思い描くのがより単純である場合、それらの戦略に落ち着く犠牲者になります。 より単純な方法で成功することはより単純であり、AI ブローカーはそれを喜んで受け入れています。 ポーカーでは、人間のゲーマーは、Libratus がもはやマッピングしておらず、正しく耐えられなかったスポーツ ツリーの部分に何度も遭遇しました。 (Libratus の助けを借りた研究者は、人間のゲーマーが眠っている夜に、スポーツ ツリーのこれらの部分で計算を実行することで、そのパフォーマンスを急いで改善しました。) Dota 2 の試合では、OpenAI により、対象市場が AI チームのキャラクターを消費することが可能になりました。 ターゲット市場は 不快なキャラクターのラインナップ (ひどいチーム)。 AI ブローカーのパフォーマンスは貧弱で柔軟性がなく、新しいキャラクターにはうまく機能していなかった同じおなじみの戦術を利用していました。 さらに、OpenAI 5 は restricted sport attach, 特定のキャラクターや種類のアクションは、スポーツの複雑さを軽減するために立ち入り禁止. OpenAI 5 の最終バージョンは、Web 上で 7,000 以上のゲームを実行し、15,000 人の人間のゲーマーに対して平均 99.4 pc という印象的な結果を達成しました。 それにもかかわらず、マネキンは、これらの数字が意味するほど丈夫ではなくなりました。 Dota 2 スポーツが開発者によって更新されるたびに、新しいキャラクター、デバイス、またはマップを追加する際、OpenAI の研究者は、AI マネキンを新しい環境に適応させるために、彼らが「手術計画」と呼んだものに耐えなければなりませんでした。 研究者は、マネキンの能力を成熟させ、より複雑な環境に投入したため、マネキンに新しい動きやアイテムを提供した場合、同様に外科的計画に耐えなければなりませんでした. このほとんど手作業のエンジニアリング パスとは異なり、新しいスポーツ環境で新しいマネキンをゼロから完全に再トレーニングする必要がありました。 重要なエンジニアリング作業や再訓練がなければ、マネキンは通常、ささやかな調整にも適応しようと戦います。 この脆弱性は、正確な世界設定では重要な不利益であると思われます。この設定では、敵の行動が開始され、環境が制限され、繰り返し可能になることはないと想像するかもしれません。
結論
ゲーム環境では、AI ブローカーのいくつかの利点は、他の利点とは異なって見られます。 超人的な精度と衝動は、一般に不公平な利点と見なされます。 という議論の余地のない真実Heron Programs の AI ドッグファイト
エージェントは、人間のパイロットによるコーチングで禁止される可能性のある銃声を収集する準備が整うと、不当な収入と見なされる可能性があります。 PC ゲームでは、プログラマーは通常、AI ブローカーの応答インスタンスを遅くして、人々の応答インスタンスと比較します。 それにもかかわらず、AI ブローカーの素晴らしい戦略的能力は、チェスや 歩行 での腕前など、一般的に賢明に知られています。 。 戦闘では、軍隊はこれらの利点を別の方法で見つめるかもしれません. 戦闘は優雅じゃないし 超人的な衝動と精度でより良い戦闘パフォーマンスを可能にすることは歓迎されているようです. 逆に、かなり謎めいた AI の意思決定は、AI ブローカーがポーカー、チェス、 ウォーク で時折作り上げる型破りなストライクに感心します。 、おそらく非常に正確には、軍隊が封じ込めるのにもっと適しているかもしれません. 反射神経が速いなど、収益が明確に識別可能な AI エージェントを軍が信じるのは、より複雑ではありません。 認知が不透明で、長期的な思考が不明な AI エージェントを信頼することは、おそらくより大きな昇進になるかもしれません。 しかし、時間の経過とともに、戦術計画や意思決定など、AI プログラムがより多くの役割を担うようになると、軍の指導者は、完全には発見できない AI プロットの推奨事項を信じるかどうかの選択に直面する可能性があります.
AI プログラムが人々と協力したい環境では、彼らの異星人の認識がおそらく不利になるかもしれません。 人間のゲーマーとの協力が必要な Diplomacy などのゲームでは、AI ブローカーは人間のデータについて特に教育を受ける必要があります。 自分でセルフプレイで教育されたAIブローカーは
プレイする.
AI プログラムを最適に消費し、AI プログラムと組み合わせる方法を見つける人間と機械の共同認知プロットにいる人々は、おそらく難しい仕事かもしれません。 AI プログラムは、あたかも分隊内のもう 1 人の兵士またはコックピット内の副操縦士であるかのように、保護イニシアチブにおいてチームメイトとして特徴付けられることがあります。 それにもかかわらず、人間-機械の認知グループは、本質的に人間-人間のグループとは異なります。 軍隊は、人間の知性にとってほとんど異質な方法で判断できる記録データ処理プロットを戦闘能力に追加しています。 AIプログラムが判断する方法の不規則な属性を参照して、人間と機械の認識をどのように結びつけ、完璧なものを収集するかについての概念を大量に効率的に獲得する軍隊は、巨大な利点を享受することができます. 米軍は、実験、プロトタイピング、およびウォーゲームに投資して、人間と機械のチーム化における独特の代替案と課題を検出することにより、今後の破壊的な調整の中で最も注目を集めることに成功することができます.
Paul Scharre は副社長であり、中部調査のディレクターです。現代アメリカのセキュリティ。 このテキストは、彼の新しいガイド から作成されています。 四つの戦場: 人工知能時代のエネルギー. Copyright (c) 2023 by Paul Scharre. 作成者、WW Norton & Firm, Inc. の許可を得て古くなっています。無断転載を禁じます。
画像: US Air Power の写真は、Airman 1st Class Trenton Jancze によるものです
%% item_read_more_button%%