GitHub コード検索は、開発者が高度なコードベースを照会するのに役立ちます。 それにもかかわらず、ツールは追加のオーダーメイドの結果と自然言語クエリのより良い支援の利点を占めることができます.
- ステファニー グレン、 データ作成者
GitHub コード検索は、開発者がコードベース全体で重要な記録データを取得するのに役立ちます。 開発者は、事実に基づいたコースの一歩として検索ツールを検討する一方で、さらに、検索結果を改善し、セマンティック クエリを支援する領域を探ります )
GitHub は、開発者が知識を必要とするため、消滅した検索エンジンや yahoo に代わるものとして、2022 年 11 月にパブリック ベータ版としてリリースされたコード検索ツールを構築しました。 GitHub のコード検索シニア エンジニアである Colin Merkel 氏は、GitHub Universe 2022 でのプレゼンテーションで、最も頻繁に埋められた内部コードであり、もはやインターネット上で見つけることができないと述べています。
ユニークな検索エンジンと yahoo のアセンブルは、もはや開発者のニーズを段階的に満たすことはできません。サンフランシスコに本社を置くモバイルアプリ構築会社、Orangesoft の iOS 技術責任者である Ryhor Supruniuk 氏は、問い合わせを含むカテゴリコードの代わりとして、次のように述べています。 GitHub コード検索により、開発者は、微弱できちんと文書化された供給開始コードと、かなりの数の開発者の集合的な記録データについて正しいことを勝ち取ることができる、と彼は述べた.
“GitHub コード検索は、ケースの詳細な覆面捜査官を提供します。そのため、能力が実際にどのように機能するかを調べて、改善の過程でどのような課題が待ち受けているか」と Supruniuk 氏は述べています。
クリックすると、検索インターフェイスにクエリを提供するための提案が表示されます。 たとえば、開発者が「所有者:jsmith ライセンス」と入力して非常に占有しているコードを検索すると、占有するリポジトリ全体にわたって、テキスト ブーム「ライセンス」を含むレコードデータとシンボルの提案が蓄積されます。
2021 年 12 月の最初のプレビューからの開発者フィードバックの結果として、GitHub は 11 月に 3 つの機能を追加しました2022: ブランド オリジナルの検索インターフェイス、ブランド オリジナルの検索エンジン、再設計されたコード アンダーカバー エージェント。 事実上のシンボル ペインは、検索の問い合わせに関連する文脈的および象徴的な記録データを提供します。 再設計されたコード アンダーカバー エージェントは、左側のパネルにファイル ツリーを組み込み、開発者がリンクされたレコードデータを取得するのに役立ちます.
「私はそれが好きです。そして宣言通り、左側にファセットを備えた結果の覆面捜査官は、私にとってきちんと整理された貴重なものです。マサチューセッツ州ケンブリッジのマーケティング テック企業 HubSpot
“/git.*commit/” のような特殊な表現は、数十億行のコードを閲覧した後に結果をすばやく回収できますが、一部の開発者は検索を声に出します。結果が乱雑に蓄積される可能性があります。 たとえば、1 つの Hacker Data スレッド フォークやめったに機能しないモデルなどの重複がディレクトリやレコードデータを監視し続け、めったに検索結果を支配しないことで有名です.
Git が支配的なモデルであるのに対し、GitHub ではマシンの監視を保持し、 Subversion は、壊れた大学モデルであり、もはや最大 リクエストの 0.02%
、Subversion のサポートを終了する予定の GitHub との節約でしたがって、検索結果に Subversion レコードデータを含めることは、GitHub では不要である、と Riley 氏は述べています 「どのクィア アーティファクトが到達して懸念を引き起こしているのか疑問に思います。 「私のマシンでは機能した」または「彼らのマシンでは機能したに違いない」とライリー氏は述べています。
GitHub は、結果ランキングの改善に取り組んでおり、ユーザーがより少ない低評価をするようになります- GitHubチームのマシンエンジニアであるティム・クレムは、次のように述べています.チームはまた、例として、ユーザーがフォークを除外できるように代替戦略のフィルタリングを支援することを計画しており、おそらく同じ結果をクラスター化して、素晴らしい結果を支援する可能性があります.
GitHub コード検索のサポート
- ブール値 OR、AND、NOT などの式。たとえば、エージェントの内部にあるマークダウンのコードや「txt」で終わるすべてのコードを覆すには、開発者は「owner:jsmith (lang:markdown OR course: *.txt.).” とはいえ、ブール検索は非常に素晴らしいものですが、トピックは現実的です。 何を覆面捜査官にするか、ライリーは言った。 その苦悩は、直感的な検索機能を追加することでほぼ確実に軽減されます.
- それでも、GitHub には、自然言語処理を検索エンジンに組み込む代替手段がありません。
- 「彼らが追加の自然言語検索を提供し始めた場合、「最短コースを見つける特性」を利用した概念検索を操作することができます。 の上に提供する技術より良い機能をより早く提供するために、再び開発者に副操縦士
を送りました」とRileyは述べました.
「それでもなお、GitHub には、自然言語処理を検索エンジンに組み込むという選択肢はありません」と、英国の市場調査会社である GlobalData PLC の概要ディレクターである Charlotte Dunlap 氏は述べています。
アップしない限り、開発者は関連するコードを入手するために Google を調べるのに何時間も費やす必要があった、と Dunlap は述べています。 ChatGPT などのジェネレーティブ AI がそのプロセスを自動化できるほど、エンタープライズ開発者の海軍にとっては、エンタープライズで差し控えようと努力するのがより簡単になります アプリケーションのモダナイゼーション 今はGitHubですがRobustCloud の重要なハンドブックである Larry Carvalho は、OpenAI を採用して敵と差別化するための精神資本を持っていますが、この応用科学の融合が機械製造に何を意味するのかは不明です。