(参考までに、これが コード で、私が作成した全体のコードです。おそらく クローンを作成して、ここに Plump アプリをデプロイします
「AskHN」は GPT-3 ボットであり、HN の集合的な知恵を特徴付けるために、650 万件を超えるハッカー ファイルのフィードバックのコーパスを基に教育しました。単一のボットのコミュニティ。 あなたがチャンスごとにそれから情報を探すかもしれないことも 私たちの不和のここで
/askhn
演説するときにもナレーションして、遊んでみてください (私は今のところ、ボットをレート制限して、OpenAI の請求書を私が倒産するのを防いでいます。
私がどのようにそれを下に構築したかについての追加の印刷物ですが、HNの知恵のLLM埋め込みの実施形態が優れた、実際には貴重なものであることに出くわしましたリソース。 何千人ものテクノロジーの最も鋭い頭脳が、長年にわたって専門知識、知恵、および控えめな炎を自発的に生み出しています。 クイズ HN ボットは、自尊心を見つけるクイズでさえも、もはや確固たる答えを導き出すことはできません!
それは仕事のアドバイスで効果的です:
...そして答えられない質問:
GPT-3 によってトリガーされた要約は非常に倫理的です! そして、リンクされた記事はすべて非常に関連しています。OpenAI GPT 埋め込みの 1500 次元は、この支出ケースのセマンティック 住居を切断するのに十分です.
それはよく知られている失敗モードです。矛盾した/ポイント以外のフィードバックを1つの応答に要約すると、一貫性が失われる可能性があります.
私はそれを
執筆時点

このアイデアはうまくいきましたが、結果は合理的に一般的なものになる傾向がありました — 技術的な説明を与えるように指示された範囲内で、つぶやきに関連するコメントの金切り声の素材を十分に引き出すことができませんでした。つぶやくソリューション。 埋め込み
6.5 の適格なフィードバック
注視最接近埋め込み (テイルズ)素数 N の一致するテイルのチェックリストを使用して、クイズ回答時にテイルに関するすべての素数フィードバックの埋め込みを導出します。 埋め込みと類似性を計算し、素数を特定します OK クイズに最も近いフィードバック
プライム マッチング フィードバックを適切な指示に入れ、GPT-3 に確認するよう要求します。文脈の活用クイズHNコーパスの取り込みとフィルタリング
ユーティリティ
firebase API
の化、HN の合計 ~35m アイテム データベースのダウンロードフィードバックと物語を並行して。 これには約 30 分かかり、4.8m の物語と 30m のフィードバックが残されました。 テイルをフィルタリングして、20 を超える賛成票があり、フィードバックが 3 つ以下の豪華なものにしました。これにより、HN の過去の合計 17,365 日間で 400,000 のテイルが残りました。 次に、最後の 5 年間の物語にさらにフィルターをかけ、160,000 の物語の最終シーケンスを残しました。 適格なフィードバックについては、適格なストーリーで最大 200 文字を使用していないものにフィルターをかけ、合計 650 万のフィードバックを得ました.GPT埋め込み素数 N の一致するテイルのチェックリストを使用して、クイズ回答時にテイルに関するすべての素数フィードバックの埋め込みを導出します。 埋め込みと類似性を計算し、素数を特定します OK クイズに最も近いフィードバック
HNコーパスの取り込みとフィルタリング
ユーティリティ
firebase API
これらの物語をインデックス化するために、2000までロードしましたトークンに相当するコメントのテキストの金切り声素材 (評価順、コメントあたり最大 2000 文字) と、各ストーリーの記事のタイトルを OpenAI の埋め込みエンドポイントに送信し、通常 を使用します。 textual screech material-embedding-ada-002
マネキン、このエンドポイントは一括アップロードを受け入れ、急いでいますが、160,000 以上のすべての事務処理をスムーズに行うには、埋め込みをモデル化するのに 2 時間以上かかりました. この株式の総価値は、以前は約 70 ドルでした.
ディスコードボット
消費者インターフェースの場合、私はAskHNをDiscordボットとして実行することにしました。 回答を制限したい場合は、Discord ボット (専用のインターネット アプリを使用する場合もあります) を使用することで、特定の人が質問や解決策を共有しなくなったとしても、よりストレスのない協力的な専門知識を得ることができます。クイズを要求するために賭けを導きます。
クイズに答える
埋め込みが一覧表示され、ボットが稼働している状態で、特定のクイズに応答するには、次の手順が必要でした:
クイズの埋め込みを計算し、松ぼっくりから情報を求めて、最も似通った素数の 3 つの物語を探します
コンテキストとしてフィードバックを使用して指示を作成し、解決策を得るために GPT-3 に送信します
私たちが埋め込みを導出する関連するフィードバックは、多くの場合、数十またはおそらくさまざまなものがあります。完了のための GPT-3 への 1 回の呼び出しでさえありません。
指示されました =
f"""{top_comments }
上記のフィードバックを要約して次のクイズに答えてください (関連する場合),
金切り声で正当化される場合はつぶやき、意見を述べる材料:
の需要: "{ クイズ
}
"
答え: """
一連のプロンプトをいじってみましたが、重要なことは、GPT-3 を派生させてその「ジェネリック」から派生させることです。スーパーハイウェイの記事」は、正当な理由がある場合は、より独断的なスタンスを教え、つかみます。 だから私はそれを合計するようにそれを教育しました、そしてそれはそうでした:)
私がここで打ち負かした方法論は、情報コーパスを具現化された知性に抽出するための一般的でスケーラブルな解決策です. ボットのアドレスをこれ以上使いますか hn.algolia.com? おそらく、おそらくもうありません。 Algolia の結果ページに追加されたこのサービスを大切にしますか? 絶対 100%. kvh@patterns.app
これと同じ構造と循環は、ほとんどすべてのテキストの金切り声素材コーパスとクイズ回答ボットで効果的に機能します。 こんなお小遣いのケースがございましたら、お気軽にご相談ください
kvh@patterns.app
いつでも私の学習について話したり、
私たちの CoDev プログラム
は Patterns にあります。 このボット
のテンプレート を複製
することから始めて、チャンスごとに派生させることもできます。 𝚆𝚊𝚝𝚌𝚑 𝙽𝙾𝚆 📺