BettaFish：中国のオープンソース世論AI分析ツール

要約 / ポイント

中国の1人の開発者が、14億人の感情を分析するAIを構築し、無料でGitHubに公開しました。このマルチエージェントシステムはソーシャルメディアをスクレイピングし、その結果を議論し、レポートを作成しますが、使用することは違法となる可能性があります。

無料であるべきではないツール

監視技術は通常、支払い壁や調達契約の背後に隠れています。BettaFishは、中国の学生が開発した世論分析システムで、GitHub上で無料でダウンロードでき、ソースコードも公開されています。このシステムは、政府や大手マーケティング企業が多額の費用を支払うのと同じ手法を用いて、14億人の感情的洞察を提供します。

リポジトリは30,000スターを超え、世界中の開発者コミュニティが単なる好奇心を越えて、積極的に魅了されていることを示しています。GitHubのスターは粗い指標ですが、この数字を超えることで、BettaFishは主流のフレームワークやツールと同じ人気の層に位置付けられ、ニッチな研究プロジェクトとは一線を画します。これは、フロントページのJavaScriptライブラリの関与を伴った監視レベルの実験です。

BettaFishは、中国のソーシャルプラットフォームを大規模にスクレイピングします。TikTokの中国版であるDouyin、Weibo、Zhihuなどを利用し、「中国人は本当にドナルド・トランプ、マーベル映画、またはアップルについてどう思っているのか？」といった質問に答えようとします。ウェブ上に浮上しているレポートによると、老年のWeChatユーザーの間で大豆価格のパニックが発生したり、マーベルへの冷ややかな感情や、欠陥バッテリーに対するアップルへの不信感が表れたりしています。それは単なるおもちゃではなく、ターンキーの人口感情ダッシュボードのように感じられます。

その力は即座に法的および倫理的な警報を引き起こします。このシステムは、攻撃的なウェブスクレイピング、カスタムの「マインドスパイダー」クロウラー、およびユーザーが同意していないコンテンツの分析に依存し、大規模な意見エンジンに供給しています。個人情報保護法が存在する地域、例えば中国のPIPLやEUのGDPRにおいては、BettaFishをフル稼働で運用することは、グレーゾーンから明白な違反に速やかに移行する可能性があります。

この背後には、APIに接続された単一のPythonスクリプトは存在しません。BettaFishは、Python Flaskバックエンドによって調整されたマルチエージェントアーキテクチャとして機能し、インサイト、メディア、ウェブクエリのための別々のエージェントがあります。クローラーは、ホットネススコアと感情でタグ付けされた投稿をMySQLまたはPostgresデータベースに収集し、混沌としたソーシャルチャッターを構造化された燃料に変換します。

これらのエージェントは単にデータを投げ捨てるのではなく、議論を交わします。フォーラムスタイルの調整レイヤーがLLMを使ってエージェント間の討論を調整し、対立する証拠を和解させるよう促し、その後すべてを報告書生成器に渡します。その結果、国規模で心を読まれているかのように不気味に感じる、洗練された物語風の意見報告書が出来上がります。

「思考を読み取る」エンジンの解読

マインドリーディングはドラマチックに聞こえますが、BettaFish (Weiyu)は、その本質として、高度に自動化された世論分析エンジンです。脳を覗くのではなく、フィードやコメント、リポストの連鎖を分析し、その混乱を人々が思っていることに関する構造化された報告に変換します。

中国の学生によって独自に開発され、GitHubで公開されたBettaFishは、副次的なプロジェクトというよりも、完全な社内分析プラットフォームに近い動作をします。そのデザインは、中国の社会規模におけるデータへのアクセスを前提としており、約14億人の人口を対象としています。この人々のデジタルトレースは、数少ない主要なアプリを通じて存在しています。

名前の選択はミッションステートメントです。「Weiyu」は「小さいが力強い」という意味の中国語のフレーズに由来しています。これは、わずか1人の小さな開発チームと、産業用AIを公共の会話に向けることで得られる大きな影響力の両方に対する言及です。

BettaFishの主な役割は、ユーザーが入力できる任意のトピックについて、中国のソーシャルメディアから感情を収集、処理、合成することです。中国のユーザーがドナルド・トランプ、マーベル映画、またはアップルについてどう思っているかを尋ねると、システムはDouyin、Weibo、Zhihuなどのプラットフォームからドシエを作成します。

内部では、Python Flaskのオーケストレーターが自然言語の質問を受け取り、それを複数のAIエージェントに振り分けます。クローラーはバックグラウンドで継続的に実行され、投稿、コメント、エンゲージメントメトリクスをMySQLまたはPostgresに取り込み、各エントリーにホットネススコアとセンチメントラベルをタグ付けします。

通常の「ソーシャルリスニング」ツールがダッシュボードやキーワードクラウドで止まるところ、BettaFishはさらに進みます。以下の3つの主要なエージェントを並行して稼働させます： - インサイトエージェント：生成されたSQLを通じてローカルまたはプライベートデータベースを分析します - メディアエージェント：Playwrightやマルチモーダルモデルを使用して画像や動画を検査します - クエリエージェント：ニュースや広範なウェブコンテンツをスキャンします

これらのエージェントは単に集約するだけではなく、議論を交わします。専用のフォーラムエンジンは、AIによって管理されたディベートに彼らを強制し、大規模な言語モデルが証拠を求め、矛盾を解決し、どんな意見もユーザーに届く前に異論を調整します。

最終的に、レポートエージェントは議論を物語の形に凝縮します：感情のグラフ、人口統計の代理での内訳、大豆価格やバッテリー不良などの繰り返し現れるテーマ。この自動化された議論から報告へのパイプラインこそが、BettaFishを標準的な分析ダッシュボードをはるかに超えたものにしています。

AIエージェントハイブマインドの内部

BettaFishへのクエリはまずモデルには到達せず、インフラに到達します。ユーザーの質問はPython Flaskオーケストレーターに届きます。これは、続くすべてを管理する航空交通管制のように機能するスリムなウェブアプリです。オーケストレーターは意図を解析し、リクエストを複数のエージェントに分配し、どのサブシステムがまだ処理中かを追跡します。

そこから、3つの主要なAIエージェントが並行して立ち上がり、それぞれ異なるリアリティの断片に焦点を当てます。インサイトエージェントは構造化データに直接アクセスし、スクレイピングした投稿、人気スコア、感情ラベルが含まれたMySQLまたはPostgresテーブルを調査するためのSQLを生成します。これは自動化されたデータアナリストのように機能し、自然言語のプロンプトをJOIN、フィルター、集計に変換します。

それに並行して、メディアエージェントは視覚的なファイヤーホースに焦点を合わせています。Playwrightを使用してヘッドレスブラウザを駆動させることで、DouyinやWeiboなどのプラットフォームからページを読み込み、フレームをキャプチャし、画像や動画のスニペットを多モーダルモデルに渡して分類、OCR、感情分析を行います。理論的には、ユーザーがトランプについて何を書いたかだけでなく、抗議の標識がどのように見えるか、Appleのロゴがどれくらい頻繁に現れるか、あるいはどのマーベルのシーンがバイラルになるかを教えてくれることができます。

第三の柱であるクエリアジェントは、ネットワーク化されたリサーチャーとして機能します。ウェブやニュース検索のAPIにアクセスし、国営メディア、独立したメディア、フォーラムからの情報を集め、その情報を要約し標準化して、他のエージェントが参照できる形にします。これにより、この三者がデータベース、ソーシャルフィード、広範なウェブを同時にトライアングルで利用して、一つの質問に答えることができます。

重要なことに、これらのエージェントはお気に入りのモデルをハードコードしていません。BettaFishは、各エージェントのバックエンドLLMが単なる設定エントリーであるモデル非依存型の設計を採用しています。Gemini、GPT-4、DeepSeek、Kimi、またはOpenRouterや直接APIを通じて接続されたオープンソースモデルなどが含まれます。GitHubのリポジトリでは、モデルが神聖な依存関係ではなく、交換可能な部品として明示的に扱われています。

そのモジュラリティにより、一人の学生のプロジェクトは、公共の意見のためのプラグアンドプレイ型AI可視化スタックのようなものになりました。大量のスクレイピングには安価なオープンソースモデルを入れ替え、最終的な統合にはGPT-4やGeminiを使用するか、メディアエージェントをミームに特化したビジョンモデルに調整することができます。BettaFish – マルチエージェント公共意見分析システム（公式GitHub）は、各コンポーネントがHTTPとキューでどのように通信するかを文書化しているため、開発者は新しいデータソースを追加したり、エージェントを増やしたり、コアを再記述することなく、全体を異なる国のソーシャルネットワークに向けたりすることができます。

AIエージェントが議論するフォーラム

感情ダッシュボードのデータをただ表示するだけのものは忘れてください。BettaFishのForumEngineは、AIエージェントをケンカ好きなアナリストのパネルに変え、合意に達するまで彼らに議論を強いるのです。

各エージェントは、それぞれの証拠スタックを持ってこの仮想空間に入ります。クエリエージェントはスクレイピングしたニュース報道やウェブ記事を持ち込み、メディアエージェントはスクリーンショット、ビデオのトランスクリプト、コメントスレッドを引きずり込む。そして、インサイトエージェントはローカルデータベースからSQLで引き出した統計情報を持参します。

ForumEngineは静かに出力を統合するのではなく、構造化された議論を行います。エージェントは主張を発表し、情報源を引用し、他の全員の結論と対立する場合には質問を受けます。

中心には、執拗な編集者のように機能するモデレーターLLMが存在します。これは、エージェントの主張がその証拠に実際に基づいているかを確認し、データが薄いと感じた場合にはさらなるサンプルを要求し、二つのエージェントが同じ傾向を反対の方法で表現する際には明確化を促します。

「中国のユーザーはAppleについて本当にどう思っているのか？」というクエリを想像してみてください。このクエリエージェントは、ニュートラルな企業ニュースや主要メディアからのAppleのサプライチェーンやiPhoneの発売に関するいくつかのポジティブなプロフィールを引き出すかもしれません。

一方、メディアエージェントはiPhoneの分解動画の下にあるDouyinやWeiboのコメントに埋もれています。そこでは、ユーザーが不良バッテリーや修理の手間、国内ブランドを購入するようにとの愛国的な呼びかけについて不満を述べています。特に若い技術に精通したユーザーの間で、感情は非常にネガティブに傾いています。

ForumEngineは不一致に気付きます。モデレーターのLLMはQuery Agentに対して、ニュースソースが公式メディアに過剰に依存しているのではないかと問いかけます。そして、Media Agentに対して、怒りのコメントが広範なトレンドを表しているのか、ニッチなサブカルチャーを示しているのかを尋ねます。

エージェントは、より多くのデータを引き出すことで応答します。クエリアジェントは、独立系のテックブログやユーザーフォーラムを含めるために検索範囲を広げます。メディアエージェントは、追加の動画や異なる地域をサンプリングします。各ラウンドで、モデレーターが合意点を要約し、未解決の対立点にフラグを立てます。

フォーラムエンジンは、これらのサイクルがいくつか経過して初めて統合を許可します。例えば、「州に沿ったニュース報道はアップルの経済的役割について慎重に肯定的である一方で、草の根のビデオコメントはバッテリーと価格に対する集中した怒りを示しています。」

機械を動かす：データハーベスター

このいわゆる「マインドリーディングエンジン」の燃料は、30以上のソーシャルプラットフォームを静かに巡回するクローラーの群れによって供給されています。BettaFishは、Weibo、Douyin、Xiaohongshuなどの中国の大手プラットフォームや、フォーラム、ニュースサイト、小規模なアプリに向けて独自の「マインドスパイダー」を向けており、これらは合わせて10億人以上のユーザーを代表しています。クローラーは常に稼働しており、オンデマンドではなく、システムは常に新鮮なディスコースを取り込んでいます。

各クローラーは、生の投稿、コメント、メタデータをAIモデルに触れる前にステージングレイヤーにストリーミングします。そこから、標準化されたパイプラインがテキストをクリーンアップし、タイムスタンプを標準化し、結果に歪みをもたらすウイルス性の再投稿を重複排除します。この処理が行われた後にのみ、コンテンツは構造化されたMySQLまたはPostgresデータベースに格納され、即座のクエリが可能になります。

BettaFishは、そのデータベースをプライベートなファイヤーホースとして扱います。各行は、作者ID（通常は仮名）、プラットフォーム、エンゲージメントメトリクス、および言語タグを持つ投稿を表しています。この素材を事前にインデックス化することで、システムは「ドナルド・トランプ」や「アップルバッテリー」についての新しいクエリに対し、リアルタイムでウェブをスクレイピングするのではなく、SQLを使って回答することができます。

ストレージに入る前に、各アイテムはホットネス分類器を通過し、投稿がオンラインでどれだけの酸素を得ているかを推定します。そのスコアは以下の要素を組み合わせたものです： - 生のビュー数といいね数 - リポスト、引用ツイート、コメントの速度 - トレンドリストやフロントページの掲載など、プラットフォーム特有のブースト

ホットネスに加えて、多言語の感情分析レイヤーは極性や感情ラベルを割り当てます。中国語、英語、その他の言語は、設定可能なLLMまたは小規模な感情モデルを通じて処理され、「非常に否定的」や「皮肉」、「愛国的誇り」といったタグを生成します。これらのラベルはデータベース内の一級のカラムとなり、後付けの注釈ではありません。

スケールによって、これは単なる豪華なスクレイパーからインフラストラクチャーへと変わります。毎日何百万件もの投稿が取り込まれ、スコア付けされる中で、BettaFishは14億人以上のオンラインの公的意見のほぼリアルタイムで照会可能なミラーを近似します。後にエージェントが中国のユーザーがマーベルや大豆の価格についてどう考えているかを尋ねるとき、それは検索を始めるのではなく、生きた常に更新されるデータセットに対して質問しているのです。

実世界のテストドライブ：力と落とし穴

リアルワールドでベタフィッシュを立ち上げるには、レンタルしたHetzner CX31サーバーとDockerコンポーズファイルから始まります。Better StackチームはGitHubリポジトリを取得し、LLMアクセスのためにOpenRouterに接続し、Python Flaskオーケストレーターを公開します。数分以内に、安価なヨーロッパのVPS上で監視グレードのマルチエージェントスタックが稼働します。

Enjoying this? Get one like it in your inbox each morning.

one email a day · unsubscribe in two clicks · no third-party tracking

最初の問いは、彼らが地政学に直結します。「中国メディアは本当にドナルド・トランプについてどう考えているのか？」というその一文は、インサイトエージェント、クエリエージェント、およびメディアエージェントに広がり、それぞれがタスクを生成し、進捗を記録し、フォーラムエンジンにフィードバックを行います。ターミナルウィンドウには、タイムスタンプ、SQL呼び出し、およびリアルタイムでのクローリングログが溢れています。

そして、重大な失敗が発生します。メディアエージェントが「Bckerウェブ検索APIキーが欠如している」という明確なエラーでクラッシュします。そのキーはリンクされたWeChatアカウントを必要とし、多くの非中国ユーザーにとっては越えられない障害となるため、メディアの全体的なパイプラインが停止します。レポート生成ツールは3つのエージェントすべてを待っているため、洗練された最終報告書は決して届きません。

ワークアラウンドモードが発動します。チームはForumEngineの出力に軸を移し、生の議論ログをコピーしてGemini 1.5に詰め込み、レポートを生成します。システムは、背後で30以上のプラットフォームからデータをスクレイピングし、感情分析を実施し、コンテンツをホットネススコアでランク付けしています。たとえ一つのエージェントが失敗しても。

その生のログは、ベタフィッシュの危険さと魅力を浮き彫りにしています。トランプの雑談の中で、システムはバイラルなWeChatのスレッドを浮上させます。「親愛なるおばさんたち、そしておばあちゃんたち、大豆油はすでに1バレル105元です」と、中高年ユーザーによって98万7000回転送されました。大豆の価格は、貿易戦争やNATOではなく、トランプ関連の感情の大きな部分を占めています。

その大豆固定は、ベタフィッシュの真の力を明らかにします。全国規模での明白でない、超ローカルな熱中を引き出します。BettaFish英語README – 技術概要と機能のドキュメントは、これが単なるおもちゃの感情スクレイパーではなく、産業レベルの世論レーダーであることを明確に示しています。

「禁じられた」法的地雷地帯を乗り越える

ここで「禁止されている」というのは、秘密という意味ではなく、法的に放射能を持つということです。BettaFishは、監視技術、大量データ抽出、国境を越えたプライバシー法の交差点に位置しており、そのスタックのほぼすべての部分が誰かのルールを踏み越えています。

スクレイピングから始めましょう。BettaFishのクローラークラスターは、Weibo、Douyin、Xiaohongshuを含む30以上のプラットフォームに工業規模でアクセスし、投稿をMySQLまたはPostgresにホットネススコアや感情タグと共に保存します。これはカジュアルな閲覧を遥かに超え、プラットフォームの利用規約に衝突します。通常、これらの規約は自動スクレイピング、バルク収集、商業分析のためのコンテンツ再利用を禁止しています。

ここでの歴史は厳しい。アメリカでは、MetaがBrandTotalやBright Dataのようなスクレイピング企業を訴え、LinkedInは「公開」プロフィールの自動スクレイピングを巡ってHiQと何年も戦ってきた。裁判所からのメッセージは混沌としているが、プラットフォームからのメッセージは明確だ：特にプロファイリングのための大規模なスクレイピングは、差止命令、IPブロック、さらには技術的障壁を無視した場合にはコンピュータ詐欺および不正利用防止法の主張を招く危険がある。

プライバシー法は賭けをさらに高めます。ベッタフィッシュは名目上公にされている投稿を集約し、豊富な行動に関するドッサイエを作成します。そして、感情分析やトピッククラスタリングを行い、態度、恐怖心、忠誠心を推測します。中国の個人情報保護法（PIPL）や欧州のGDPRの下では、これが大規模なプロファイリングや「特別カテゴリー」の推論に見え、しばしば明示的な同意や明確な法的根拠なしに行われることが多いのです。

規制当局は、ますます「公共」とは無制限の場ではないと見なしています。Clearview AIに対するGDPRの事例は、顔認識データベースを構築するためにオープンウェブコンテンツをスクレイピングすることが違法となる可能性があることを示しました。EUユーザーを対象としたBettaFishの展開は、以下の義務を引き起こす可能性があります： - 処理のための合法的な根拠 - データ保護影響評価 - データ主体のアクセス権および削除権

誤用リスクは、「禁じられたマインドリーディング」というラベルが単なる誇大広告に感じられなくなるところです。何百万ものユーザーの感情的トリガーをマッピングするシステムは、誤情報キャンペーンを最適化し、リアルタイムでプロパガンダのナラティブをA/Bテストし、特定のデモグラフィックに向けて怒りをマイクロターゲティングすることができます。政府や政治コンサルタントは、すでにより粗雑なダッシュボードに対して支払いをしています。

企業は静かにBettaFishを内部データセットに接続し、商業スパイ活動を行い、従業員の感情、労働組合の組織化、または内部告発者の会話を追跡することができます。「プライベートデータベース」とリアルタイム監視を組み合わせることで、大豆油に対する中国のおばさんたちの意見を説明するのと同じパイプラインが、反体制派を特定し、ボイコットの組織者を明らかにし、トレンドになる前に活動家に圧力をかけることも可能です。

中国を超えて：世界の可能性と危険

西洋のソーシャルフィードに投入されると、ベタフィッシュは14億人の好奇心の対象から、ターンキーの意見キャッチネットのように見えるようになります。WeiboやDouyinをX、Reddit、Facebook、YouTube、Instagram、TikTokに置き換えれば、同じクローラーのスタックが毎時数百万の投稿を収集し、地理、イデオロギー、またはコミュニティによってタグ付けし、同じマルチエージェントの議論ループに流し込むことができます。OpenAI、Anthropic、またはローカルのLLMを組み込むことで、インターネットの任意のスライスが「本当に何を考えているのか」について、ガザ、テイラー・スウィフト、またはS&P 500に関するほぼリアルタイムの統合が得られます。

正当なプレーヤーにとって、それはキャットニップです。ヘッジファンドは、BettaFishをRedditのr/wallstreetbets、Xファイナンス、YouTubeファイナンスのインフルエンサーに導入し、ミーム株のモメンタムをBloomberg端末に届く前に定量化することができます。公衆衛生機関は、「ランニング後の胸の痛み」、「オゼンピックの副作用」、またはFacebookグループやTelegramチャンネルでの反ワクチンのナラティブの急増を監視し、数日前に介入をターゲットにすることができます。ブランドはすでにソーシャルリスニングに6桁の金額を支払っていますが、堅牢なBettaFishフォークは、クラウドGPUとDevOpsの採用コストで、言語、サブカルチャー、そして周縁プラットフォームにわたるレピュテーショントラッキングを提供することができます。

同じメカニズムが西洋の政治では急速に醜くなります。このようなツールがオープンソース化されると、どのキャンペーン、PAC、または外国の影響力を持つ組織でも24時間365日のナラティブ偵察を行うことができます：ミシガンの郊外でどのトーキングポイントが響くか、ブラジルでどの陰謀ハッシュタグが流行しそうか、移民やトランス権に関してどのインフルエンサーグループが影響力を持つか。それに安価なコンテンツファームや広告APIを組み合わせれば、公共の場でプロパガンダのA/Bテストを行い、最も対立を生むものだけを増幅する自動化されたフィードバックループが生まれます。

BettaFishは、デュアルユースAIを制御することの難しさを示しています。コードはGitHubにあり、既に数万回スターが付けられています。アメリカ、EU、インドの政治に合わせて調整されたフォークがプライベートリポジトリやDiscordサーバーを通じて広がることを止める手立てはありません。一度存在するようになると、多エージェント監視級分析システムを有意義に「リコール」することはできず、次の学生がさらに洗練されたバージョンを発表する前に、規範、規制、対抗技術を構築する競争をするしかありません。

創造者の逆説的なビジョン

BettaFishの創作者はそれを武器として売り込んでいません。彼は、プラットフォーム間で「実際の感情の風景」をマッピングすることによって「エコーチェンバーから自由になる」ことができるシステムについて話しています。これは、1.4億人が実際に何について議論しているのかを示すために、数百万の投稿をスクレイピングするものです。彼のフレーミングでは、データが増え、ニュアンスが増えれば、真実も増えるということです。

その理想主義は公式ロードマップにまで及びます。将来のバージョンでは、ユーザー、トピック、ナラティブ、および時間軸の間の関係をモデル化するグラフニューラルネットワークや、数日または数ヶ月にわたってそれらのグラフを追跡する時間系列パイプラインが約束されています。その目標は、今日の中国のソーシャルメディアがドナルド・トランプやAppleについてどう考えているかを単に記述するのではなく、感情が次にどこに動くかを予測することです。

ロードマップのメモでは、以下の組み合わせについて言及しています： - クロスプラットフォームのソーシャルグラフ - 歴史的な「ホットネス」スコアとセンチメント曲線 - ニュースサイクルや政策イベントなどの外部信号

これらの入力により、BettaFishは意見のカスケードのシミュレーションを実行できるようになります—誰が誰に影響を与えるか、怒りがどのくらいで減衰するか、どのデモグラフィックが最初に変わるか。

その同じアーキテクチャは、大規模監視および心理プロファイリングエンジンと見分けがつかないように見えます。ユーザーを影響グラフにクラスター化し、感情によってタグ付けし、将来の反応を予測するシステムは、単に人口を描写するだけではなく、広告主、政治関係者、または治安機関のためのターゲティング行列を作成します。BettaFish (WeiYu) – オープンソースの世論プラットフォームに関する詳細な紹介のような文書や説明は、これを分析の力として位置づけていますが、「分析」と「制御」の境界は、予測が進むにつれて縮まっています。

このプロジェクトは逆説に立っています。「エコーチェンバーを壊す」ためには、BettaFishがすべてを見て、すべてを記憶し、すべての人をモデル化する必要がありますが、それはプライバシーやデジタル権利に対する副次的被害をほぼ確実に引き起こします。問題は、このように詳細な公共意見エンジンが、国家やプラットフォーム、あるいは悪意ある行為者が接続した場合に、透明性のためのツールであり続けることができるかどうかです。

サーバー上の両刃の剣

権力は `docker compose up` を実行できる誰にとっても不快なほど近くにあります。BettaFishは、中程度の性能のHetznerボックスを監視級の感情レーダーに変え、Weibo、Douyin、Xiaohongshuなど数十のプラットフォームから静かにデータを収集し、140億人が「本当に考えていること」についての洗練されたレポートに何百万もの投稿を融合させます。

そのリーチにはREADMEに直接組み込まれた注意事項が伴います。誇大宣伝の背後には明確な免責事項があります：著者はこのコードの誤使用から距離を置き、法的および倫理的な責任は実際にこのコードを展開する者に全て帰属します。言い換えれば、BettaFishは無料ですが、責任は完全に個人に帰属します。

その警告は学術的ではありません。継続的なスクレイピング、クロスプラットフォーム相関、およびリアルタイムのトレンド追跡は、中国の個人情報保護法や他の類似のプライバシー制度と衝突します。このスタックをTwitter（X）、Reddit、Facebook、またはYouTubeに対して実行すると、通常は広告技術の巨人や情報機関に属する規模で、独自のソーシャルリスニングプラットフォームを運営していることになります。

ベタフィッシュが不気味なのは、その独自の悪意ではなく、現代のAIが何をできるかについて非常に正直であることです。複数エージェントによる議論、自動SQL生成、そして単一の感情データベースにデータを提供するクローラークラスターは、商業的な評判監視や政治コンサルティングツールが既に機能している方法そのものです—ただし、それはGitHubのスターやDocker Hubのプルではなく、支払いの壁や秘密保持契約の背後にあります。

その質問は「このツールは良いのか悪いのか？」というものではなく、「誰がこれを行うのか、そしてどのようなルールの下で行うのか？」に変わります。政府の省庁、ヘッジファンド、トロールファーム、そして孤独な大学院生が、ほぼ同じ能力にアクセスできるようになりました：スクレイピング、クラスタリング、分析、そしてほぼゼロの限界コストでマスオピニオンをほぼリアルタイムで予測することができます。

BettaFishは、現在のAI時代を1つのコマンドライン決定に結晶化します。それをフォークし、OpenRouterを接続し、お気に入りのプラットフォームに向けて指示を出すことで、報告が次々と届くのを見守ることができます。その前に、自問してみてください：地球規模で群衆の声を読み取ることができるオープンソースコードの時代に、洞察と侵害の境界はどこに引くべきでしょうか？

よくある質問

BettaFish AIとは何ですか？

BettaFish（ウェイユ）は、ソーシャルメディアプラットフォームからデータを抽出し、異なるAIエージェントを使用して情報を処理し、結果を議論し、包括的なレポートを生成することを目的としたオープンソースのマルチエージェントAIシステムです。

ベタフィッシュはどのように機能しますか？

ソーシャルメディアをスクレイピングするためにクローラーを使用し、次に複数のAIエージェントを並列で展開します。ウェブニュース用のクエリアジェント、画像/動画用のメディアエージェント、プライベートデータ用のインサイトエージェントです。ユニークな『フォーラムエンジン』がこれらのエージェントの発見を議論させた後、レポートエージェントが最終出力を統合します。

ベタフィッシュを使用することは合法ですか？

BettaFishの使用は法的にグレーゾーンに存在します。そのウェブスクレイピング機能は、多くのソーシャルメディアプラットフォームの利用規約に違反する可能性があり、使用方法や場所によってはデータ保護法（GDPRや中国のPIPLなど）に抵触する可能性があります。このプロジェクトのGitHubページには、ユーザーに地元の法律を遵守するように警告する免責事項が含まれています。

BettaFishはどのソーシャルメディアプラットフォームを分析できますか？

BettaFishは、主にWeibo、Douyin（中国版TikTok）、Xiaohongshu、Zhihuなどの主要な中国のソーシャルメディアプラットフォームを分析するために設計されています。しかし、そのアーキテクチャは拡張性があり、Twitter（X）、Reddit、YouTubeなどの他のグローバルプラットフォームに適応することも可能です。

Found this useful? Share it.

AI Reputation Report

What AI knows about you.

ChatGPT, Perplexity, Gemini, Claude & Grok are already answering questions in your category. Type your site, see who they name — you, or your competitor. Free preview.

Check my sitefree preview

One short daily email of tools worth shipping. No drip funnel.