Stack Overflow のボランティアモデレーター、AI の削除を妨げる秘密の新ポリシーをめぐりツールを停止
ホームページホームページ > ブログ > Stack Overflow のボランティアモデレーター、AI の削除を妨げる秘密の新ポリシーをめぐりツールを停止

Stack Overflow のボランティアモデレーター、AI の削除を妨げる秘密の新ポリシーをめぐりツールを停止

Mar 30, 2023

スタック・オーバーフローのモデレーターの多くは、AI生成コンテンツを「極めて限定的な状況を除いて」削除しないよう指示されたことに抗議し、「一般モデレーション・ストライキ」を宣言した。

2 つの重要な問題は 1 つ目です。1 つは、モデレータが新しいポリシーのせいで品質チェックの役割を効果的に実行できないと感じていることです。 そして第二に、その政策が適切な協議なしに押しつけられたということである。

「モデレーターは、非常に狭い状況を除き、AI が生成した回答を削除することをもはや許可されていません。これにより、AI が生成したほぼすべての回答は、そのようなコミュニティで確立された合意に関係なく、事実上自由に投稿されることになります。」コンテンツだ」と印象的なMODたちは公開書簡で述べた。

「私たちは、質問と回答の形で質の高い情報のリポジトリを提供するという Stack Exchange ネットワークの中核的使命を深く信じています。Stack Overflow, Inc. が最近とった行動は、その目標にとって直接的に有害です。」彼らは付け加えた。

このサイトはまだ運営されているが、特にスパムを検出するためにCharcoal for StackOverflowというボランティアネットワークによって開発されたSmokeDetectorというツールも稼働を停止しているため、スパムと報告されていないコンテンツの量は増加する可能性がある。 「注意: Charcoal はネットワーク全体のストライキに参加しているため、この AI ポリシーが廃止されるまで閉鎖されたままになります」と、サイトのディスカッション スレッドに通知が記載されていました。

DevClassは、署名者の一人であるノルウェーを拠点とするモデレーターのゾーイ氏に話を聞いた。 「これまでのところ、正式にストライキ中である SO のアクティブな MOD は (私が正しく数えていれば) 15/24 ありますが、残りはフラグの量に追いつく見込みがありません」と彼女は私たちに語った。

背景には、StackOverflowがQ&Aサイト上でGitHub CopilotやChatGPTなどのAIツールの影響を理解するのに苦労しているようだということがある。 交通量が減りました。 同社の最初の反応は、コミュニティの承認を得て、スタック オーバーフローの回答を投稿するための ChatGPT の使用を「一時的なポリシー」で禁止することでしたが、公式スタッフの投稿には、「当社は、スタック オーバーフローの回答を投稿するためのネットワーク全体の一般的なポリシーは何も決定していません」とも述べられています。 ChatGPT やその他の AI 生成コンテンツを禁止することは、現時点では必要であるか、有益です。」 開発者サイトである Stack Overflow と、さまざまなトピックを幅広くカバーするサイト ファミリである Stack Exchange の間には違いがありますが、Stack Overflow が最も混雑しています。

先週、CEO の Prashanth Chandrasekar 氏は、Stack Overflow における AI の役割について肯定的な投稿をし、「GenAI の台頭は Stack にとって大きなチャンスです。当社の約 10% は、エンゲージメントを高める可能性のある GenAI を活用した機能とアプリケーションに取り組んでいます」と述べました。 。」 チャンドラセカールは「AIとコミュニティが中心」であると書いている。 しかし、モデレータの行動は、コミュニティの側面が現在疑わしいことを示唆しています。

今回の危機の引き金となったのは、先週の月曜日(祝日)、公式だが非公開のフォーラムでスタック・オーバーフローのモデレーターに宛てた指示だった。「モデレーターは、さまざまなモデレーター・ルームに固定されたチャット・メッセージを通じて(通常の方法ではない)、モデレーターチームの投稿を参照してください。モデレーター全員に、モデレーションアクションを実行する際に(上記で概説した)AI 検出器の使用を中止するよう指示しました。」と投稿には記載されています。 指導内容の詳細は非公開。 コミュニティ担当副社長 Philippe Beaudette は、「AI 生成コンテンツはネットワーク全体で適切に識別されていない」、「誤検知の可能性が非常に高い」、「AI 生成コンテンツに対する一時停止の過剰適用を内部証拠が強く示唆している」と投稿しました。サイトへの多数の正当な寄稿者を拒否している可能性があります。」 同氏は、モデレータらは「ユーザーの停止を決定する際に、投稿がAIによって作成されたものであるかどうかを判断するために、非常に厳格な証拠基準を適用する」よう求められていると述べた。 しかし、モデレーターらは、Beaudette が投稿したポリシーの説明は「Teams のガイダンスとは大きく異なっており、公に共有することは許可されていない」と主張しています。

ゾーイ氏は私たちに、「公開バージョンでは、GPT コンテンツの疑いで MOD が一時停止をやめるよう指示された部分や、その他のさまざまな詳細が曖昧になっている」と語った。 同氏はまた、自動AI検出器の信頼性が低いことはよく知られており、受け入れられているが、「当社の検出システムのほとんどはAI検出器に依存していない。まさにその信頼性が低いからだ」とも述べた。 彼女は私たちに、「『GPT 検出器にはバイアスがある』から『かなりの量の一時停止が間違っている』へのビットジャンプは、AI コンテンツを検出するあらゆる方法を事実上禁止する」と述べましたが、検出器のバイアスの証拠だけを示し、そうではありませんでした。保留バイアス/偽陽性率については、大きな問題が提起されています。」

実際には、ChatGPT ポリシーの適用は、ユーザーの行動パターンと他の技術の組み合わせによって導かれてきたと彼女は説明しました。 「同社と何度も広範な議論を行ったが、検出器の誤検知率が一時停止に何らかの影響を与えたことを裏付けるデータを同社から得ることができなかった」と彼女は述べた。

モデレータはボランティアであり、サイトへのトラフィックのレベルではなく、コンテンツの品質を懸念している。「トラフィックは通常、会社の問題であると考えられている」とゾーイ氏は語った。

同社は非公開の2回目のポリシー変更を計画していたが、モデレーターによれば、これは「前例のないレベルの不正行為を助長する可能性がある」という。 この 2 番目の変更 (脚注 3) は、おそらくモデレーターの反対の結果として「無期限に延期」されました。

問題は複雑ですが、注目に値するのは、ChatGPT を禁止するポリシーがコミュニティでかなりの支持を得ており (執筆時点で +3677)、これは最もアクティブな Stack Overflow メンバーが AI が生成する回答を警戒していることを示唆しているということです。

Dev Class に送られた声明の中で、Stack Overflow の Beaudette 氏は次のように述べています。

「Stack Overflow ネットワーク全体の少数のモデレータ (11%) が、コンテンツのモデレートを含むいくつかの活動への関与を停止しました。この措置の主な理由は、AI によって生成されたコンテンツに関する検出ツールに対する当社の立場への不満です。」

「Stack Overflow が分析を実行したところ、モデレーターが以前使用していた ChatGPT 検出ツールの誤検知率は驚くほど高かった。これらのツールの使用は、事前にコンテンツを投稿したことがほとんどない、またはまったくないユーザー、つまり独自の質問をしたユーザーの停止数の劇的な増加と相関関係があった」これらの不必要な停止と新規ユーザーへの甚大な影響は、私たちの使命に反し、私たちのコミュニティに悪影響を及ぼします。

「私たちは、モデレータに以前に使用されていたツールの使用を停止するよう要求するという決定を支持します。私たちは引き続き代替手段を探し、それらのツールの迅速なテストに取り組んでいきます。」

「私たちのモデレーターは長年にわたってこのコミュニティに貢献しており、彼らの数十年にわたる貢献に感謝しています。私たちは前進する道が見つかると確信しています。行動がここまで進んだことを遺憾に思っており、コミュニティ管理チームは現在の状況を評価しています」私たちは短期的に事態を安定させるために懸命に取り組んでいるので、状況を改善する必要がある」と同氏は付け加えた。