このブログ投稿では、偽の GitHub スターのトピックを探ります。 それらを識別するための手段を共有し、あなたが惹かれているレポでこの予測を弱めることを勧めます. ここをクリックして、バックグラウンドの記録を飛ばして、コードに正確にジャンプします.
そして、この記事を体験しながら、Dagster レポ であり、確固たる GitHub の巨人 ID を提供してくれます!
GitHub のスターは間違いなく人間の 1 人です y GitHub の社会的証明の重要な指標。 一見すると、それらはうぬぼれの指標のようなものであり、Facebook の「宝物」や Twitter のリツイートほど客観性はありません。 しかし、それらは、どのタスクが企業によって安全に荒廃され、どのスタートアップに安全な資金が提供され、どの企業の有能な専門家が半分を占めているかなど、極端でリスクの高い決定に影響を与えます.
Dagster プロジェクトに移動して、レポを巨大に識別します。GitHub の巨大な識別は、さまざまなタスクの識別に依存していることに注意してください。 そのため、週に何百もの星を獲得する警告なしにいくつかの新しい起動ソースタスクを見つけた後、私たちは感銘を受けました. 場合によっては、少し正確すぎて正確ではないように見え、パターンが印象的でした: いくつかのトレース新しいレポは、2 日間で数百の星の負荷で急上昇し、新しい解放に間に合うように最も着実に正確になりました。または他の重大な発表.
私たちはそれらのリポジトリの一種をスペースチェックし、疑わしい偽の検索アカウントを見つけました.
ほとんどの GitHub 巨人が予測ツールまたは その話題を隠す記事は、フェイクスターの浮気を扱っていません.
スター フォー マネーを提供している疑わしい企業があることを知っていたので、ダミーのレポを作成しました (pygithub
経由) と
では、魔法使いはどこにいるのでしょうか出演者? 悲しいウェブをオンラインで旅する必要はありません。 Google で検索すれば、何十もの企業をすぐに見つけることができます。
これらの企業によって荒廃させられた偽の GitHub クロニクルのプロファイルの青写真を公開するにあたり、以下の企業からスターを購入しました:
バッディショップ – 公に影響力のあるオンライン メトリックの注目に値する美しい音のフェイクのスペシャリスト。 彼らはあなたに 1,000 個の偽の GitHub スターを 64 ドルで売るつもりです.Möller und Ringauf GbR のプロバイダーである GitHub24 は、巨大な ID あたり 0.85 ユーロで注目に値します。彼らの信用ランキングを提示するために、セレブはすぐにレポに配信されました. GitHub24 は 48 時間で 100 個の星を獲得しました。 これは、それまでは究極の 3 つ星だったレポの主な景品になりました。 Baddhi Shop は、500 個の星を注文したとき、より大きな質問をしましたが、これらは 1 週間ほどで到着しました.
それは、あなたが支払ったものは安全であるということです. 1 か月後、GitHub24 のスター 100 人全員がミュート状態になりましたが、最終的に 4 分の 3 の偽のバディ ショップ スターが残っていました。 緩和は GitHub の整合性グループによって削除されたのではないかと考えています。
私たちは、偽の巨人が GitHub 上でいかに不快な状況になったかを解決したいと考えていました。 これを解明するために、私たちはアラナと協力しましたGlassco、スパムと悪用について教育を受け、事実を掘り下げ、GitHub アーカイブ データベース。単にいくつかの偽の星を魅了し、忠実な星と偽の星を識別するための分類器を提供するだけです。 一方で、これには多くの懸念があることを示唆しています.
どの側面? スパマーは敵対的であり、検出を積極的に回避しています。他の多くの – 最も着実に難読化されています.適時配置 検出を明らかにするために、スパマーは継続的に戦術を変更して検出を明らかにします。 ラベル付けされた知識を得るのは難しく、ラベル付けされた知識でさえ、マネキンが再訓練されるまでには古くなっています.スパムの検出では、スパマーを特定するためにヒューリスティックとマシンの検出を繰り返し使用します。 私たちの場合、本質的にヒューリスティックにプッシュされた手段になりました.
偽の GitHub スターを販売した後、偽のスターのコホートが 2 つあることがわかりました:
明らかな偽物。 あるコホートは、自分たちのプロセスを隠蔽するのにあまり力を入れなくなりました。 彼らのプロフィールを検索しただけで、彼らが堅実な記録ではないことがすぐに明らかになりました.洗練された偽物. 反対のコホートはすぐに注目に値するほど高度になり、偽のアカウントであるという真実を隠すための検索プロセスを備えた何百もの頑固なアカウントを作成しました.
最終的に、すべてのコホートを識別するために 2 つの別々のヒューリスティックを使用しました.
偽の巨人を特定するための調査期間中に、数百の 1 回限りのプロファイルが見つかりました。これは、正しい 1 つまたは 2 つの GitHub リポジトリに「スターを付ける」ことのみを目的として作成された偽の GitHub アカウントです。 それらは、将来の特定されていない時間 (クロニクルが作成された日、ブループリント リポジトリがスター付きになった日) のプロセスを示しています。
これらのアカウントに関する追加の知識を得るために GitHub API を荒廃させたところ、明確なサンプルが出現しました。 これらのアカウントは、非常に制限されたプロセスによって特徴付けられました:
作成2022年以降フォロワー数 <=1 意識して )=1li>=1li>𝚆𝚊𝚝𝚌𝚑 𝙽𝙾𝚆 📺