TL;DR / Key Takeaways
Das Werkzeug, das nicht kostenlos sein sollte
Überwachungstechnologie versteckt sich normalerweise hinter Bezahlschranken und Beschaffungsverträgen. BettaFish, ein System zur Analyse öffentlicher Meinungen, das von einem einzelnen chinesischen Studenten entwickelt wurde, ist als kostenloser Download, einschließlich Quellcode, auf GitHub verfügbar. Es verspricht Sentiment-Einblicke über 1,4 Milliarden Menschen, und zwar mit denselben Techniken, für die Regierungen und Marketing-Riesen ernsthafte Summen zahlen.
Das Repository hat die Grenze von 30.000 Sternen überschritten, ein Zeichen dafür, dass die globale Entwicklergemeinschaft nicht nur interessiert, sondern aktiv begeistert ist. Sterne auf GitHub sind eine grobe Metrik, aber diese Marke zu überschreiten, bringt BettaFish in die gleiche Beliebtheitsskala wie gängige Frameworks und Tools, nicht in die Nische von Forschungsprojekten. Dies ist ein experimentelles Projekt in Überwachungsqualität mit der Beteiligung einer JavaScript-Bibliothek für die Titelseite.
BettaFish durchsucht chinesische soziale Plattformen in großem Umfang – Douyin, das chinesische Pendant zu TikTok, Weibo, Zhihu und weitere – und versucht dann, Fragen wie „Was denken chinesische Menschen wirklich über Donald Trump, Marvel-Filme oder Apple?“ zu beantworten. Berichte, die im Internet kursieren, zeigen, dass es Preissorgen bei Soja unter älteren WeChat-Nutzern aufdeckt, gemischte Gefühle gegenüber Marvel und Misstrauen gegenüber Apple aufgrund defekter Batterien. Es wirkt weniger wie ein Spielzeug und mehr wie ein schlüsselfertiges Dashboard zur Bevölkerungsstimmung.
Diese Macht löst sofort rechtliche und ethische Alarmglocken aus. Das System stützt sich auf aggressives Web-Scraping, einen maßgeschneiderten "Mind Spider"-Crawler und die Analyse von Inhalten, denen die Nutzer niemals zugestimmt haben, um sie in eine Massenmeinungsmaschine einzuspeisen. In Rechtsordnungen mit Gesetzen zum Schutz persönlicher Daten – von Chinas PIPL bis zur EU-DSGVO – könnte der Betrieb von BettaFish im vollen Umfang schnell von einer Grauzone zu einem klaren Verstoß übergehen.
Im Hintergrund handelt es sich nicht um ein einzelnes Python-Skript, das mit einer API verbunden ist. BettaFish läuft als eine Multi-Agenten-Architektur, die von einem Python Flask-Backend orchestriert wird, mit separaten Agenten für Einblicke, Medien und Webabfragen. Ein Crawler füllt MySQL- oder Postgres-Datenbanken mit Beiträgen, die mit Hotness-Scores und Sentiment gekennzeichnet sind, und verwandelt chaotische soziale Gespräche in strukturierte Treibstoffe.
Diese Agenten schütten nicht einfach Daten aus; sie argumentieren. Eine koordiniert-forumartige Schicht lässt LLMs eine Debatte zwischen den Agenten moderieren, zwingt sie, widersprüchliche Beweise zu reconciliieren, und leitet dann alles an einen Berichtsgenerator weiter. Das Ergebnis: ausgefeilte, erzählerisch gestaltete Meinungsberichte, die auf nationaler Ebene beunruhigend nah am Gedankenlesen erscheinen.
Die Entschlüsselung des 'Gedankenlese'-Motors
Gedankenlesen klingt dramatisch, aber BettaFish (Weiyu) ist im Kern eine hochautomatisierte Public-Opinion-Analysemotor. Es dringt nicht in Gehirne ein; es durchforstet Feeds, Kommentare und Repost-Ketten und verwandelt dieses Chaos dann in strukturierte Berichte darüber, was die Menschen zu denken scheinen.
Entwickelt von einem einzelnen chinesischen Studenten und auf GitHub veröffentlicht, verhält sich BettaFish eher wie eine vollwertige interne Analyseplattform als wie ein Nebenprojekt. Sein Design geht von einem Zugriff auf Daten im chinesischen Maßstab aus und richtet sich an eine Bevölkerung von etwa 1,4 Milliarden Menschen, deren digitale Spuren sich durch eine Handvoll dominierender Apps ziehen.
Die Namenswahl ist ein Leitbild. „Weiyu“ stammt aus einem chinesischen Ausdruck, der „klein, aber mächtig“ bedeutet, und verweist sowohl auf das kleine Entwicklerteam (eine Person) als auch auf den übergroßen Einfluss, den der Einsatz von industrietauglicher KI auf öffentliche Gespräche hat.
Die Hauptaufgabe von BettaFish: Sentiment aus sozialen Medien in China zu extrahieren, zu verarbeiten und zu synthetisieren, zu jedem Thema, das ein Nutzer eingeben kann. Fragen Sie, was chinesische Nutzer über Donald Trump, Marvel-Filme oder Apple denken, und das System erstellt ein Dossier aus Plattformen wie Douyin, Weibo und Zhihu.
Unter der Haube empfängt ein Python Flask Orchestrator eine Frage in natürlicher Sprache und verteilt sie an mehrere KI-Agenten. Ein Crawler läuft kontinuierlich im Hintergrund und speichert Beiträge, Kommentare und Engagement-Metriken in MySQL oder Postgres, wobei jeder Eintrag mit einer Hotness-Bewertung und einem Sentiment-Label versehen wird.
Wo typische „Social Listening“-Tools bei Dashboards und Keyword-Wolken aufhören, geht BettaFish weiter. Es aktiviert drei Hauptagenten parallel: - Ein Insight-Agent, der lokale oder private Datenbanken über generiertes SQL analysiert - Ein Media-Agent, der Bilder und Videos mithilfe von Playwright und multimodalen Modellen untersucht - Ein Query-Agent, der Nachrichten und umfassendere Webinhalte durchsucht
Diese Agenten aggregieren nicht nur; sie argumentieren. Eine spezialisierte Forum-Engine zwingt sie zu einer von KI moderierten Debatte, wobei ein großes Sprachmodell nach Beweisen verlangt, Widersprüche auflöst und abweichende Meinungen in Einklang bringt, bevor etwas den Nutzer erreicht.
Schließlich verdichtet ein Berichtagent die Debatte in narrative Form: Diagramme der Stimmung, Aufschlüsselungen nach demografischen Proxys, wiederkehrende Themen wie Sojabipreise oder Batteriemängel. Diese automatisierte Argumentations-zu-Bericht-Pipeline hebt BettaFish weit über standardmäßige Analyse-Dashboards hinaus.
Innerhalb des KI-Agenten Kollektivs
Abfragen zu BettaFish erreichen nicht zuerst ein Modell; sie landen direkt auf der Infrastruktur. Die Frage eines Nutzers gelangt zu einem Python Flask Orchestrator, einer schlanken Webanwendung, die wie ein Luftverkehrsleiter für alles Weitere fungiert. Sie analysiert die Absicht, verteilt die Anfrage auf mehrere Agenten und behält den Überblick darüber, welches Teilsystem noch denkt.
Von dort aus werden drei primäre KI-Agenten parallel aktiviert, die jeweils auf einen anderen Abschnitt der Realität ausgerichtet sind. Der Insight-Agent kommuniziert direkt mit strukturierten Daten und generiert SQL-Abfragen, um MySQL- oder Postgres-Tabellen abzufragen, die mit gesammelten Beiträgen, Hotness-Werten und Sentiment-Labels gefüllt sind. Er verhält sich wie ein automatisierter Datenanalyst, der eine Eingabe in natürlicher Sprache in JOINs, Filter und Aggregationen umwandelt.
Neben ihm konzentriert sich der Media Agent auf den visuellen Datenstrom. Mit Playwright, um kopflosen Browsern Antrieb zu geben, lädt er Seiten von Plattformen wie Douyin oder Weibo, erfasst Bilder und übergibt diese oder Videoausschnitte an multimodale Modelle zur Klassifizierung, zur optischen Zeichenerkennung (OCR) und zur Sentiment-Analyse. Theorie zufolge kann er nicht nur mitteilen, was Benutzer über Trump geschrieben haben, sondern auch, wie Protestplakate aussahen, wie oft Apple-Logos auftauchen oder welche Marvel-Szenen viral gehen.
Der dritte Pfeiler, der Abfrage-Agent, fungiert als vernetzter Forscher. Er nutzt Web- und Nachrichtensuch-APIs, bezieht Informationen aus Staatsmedien, unabhängigen Plattformen und Foren und fasst diese Quellen dann zusammen und normalisiert sie in eine Form, die es den anderen Agenten ermöglicht, sie zu kreuzreferenzieren. Gemeinsam kann das Trio eine einzelne Frage beantworten, indem es Datenbanken, soziale Feeds und das breitere Web gleichzeitig trianguliert.
Entscheidend ist, dass keiner dieser Agenten ein bevorzugtes Modell fest codiert. BettaFish verwendet ein modellagnostisches Design, bei dem das Backend-LLM jedes Agenten lediglich als Konfigurationseintrag aufgeführt ist: Gemini, GPT-4, DeepSeek, Kimi oder Open-Source-Modelle, die über OpenRouter oder direkte APIs eingebunden werden. Das Repository auf GitHub behandelt Modelle ausdrücklich als austauschbare Teile, nicht als heilige Abhängigkeiten.
Diese Modularität verwandelt das Projekt eines Studenten in eine Art Plug-and-Play AI-Observability-Stack für die öffentliche Meinung. Ersetzen Sie ein günstigeres Open-Source-Modell für die massenhafte Datensammlung, reservieren Sie GPT-4 oder Gemini für die finale Synthese oder spezialisieren Sie den Media Agent mit einem Bildmodell, das auf Memes abgestimmt ist. BettaFish – Multi-Agent Public Opinion Analysis System (Offizielles GitHub) dokumentiert, wie jede Komponente über HTTP und Warteschlangen kommuniziert, sodass Entwickler neue Datenquellen hinzufügen, weitere Agenten integrieren oder das gesamte System auf die sozialen Netzwerke eines anderen Landes ausrichten können, ohne den Kern neu schreiben zu müssen.
Das Forum, in dem KI-Agenten diskutieren
Vergiss Sentiment-Dashboards, die nur Diagramme ausspucken. BettaFishs ForumEngine verwandelt seine KI-Agenten in ein Gremium streitlustiger Analysten, die gezwungen sind, zu diskutieren, bis sie zu einer Art Konsens gelangen.
Jeder Agent tritt mit seinem eigenen Evidenzstapel in diesen virtuellen Raum ein. Der Abfrage-Agent bringt gesammelte Nachrichtenberichte und Webartikel mit, der Medien-Agent bringt Screenshots, Video-Transkripte und Kommentarstränge herein, und der Einsicht-Agent erscheint mit per SQL abgerufenen Statistiken aus lokalen Datenbanken.
Anstatt die Ergebnisse stillschweigend zu vereinen, führt ForumEngine eine strukturierte Debatte. Die Agenten präsentieren Behauptungen, führen Quellen an und werden in Frage gestellt, wenn ihre Schlussfolgerungen mit denen der anderen in Konflikt stehen.
Im Zentrum steht ein Moderator-LLM, der wie ein unermüdlicher Redakteur agiert. Er überprüft, ob die Behauptung eines Agenten tatsächlich aus den vorliegenden Beweisen folgt, fordert weitere Proben an, wenn die Daten dünn erscheinen, und drängt auf Klärung, wenn zwei Agenten denselben Trend auf gegensätzliche Weise beschreiben.
Stellen Sie sich eine Abfrage vor wie: „Was denken chinesische Nutzer wirklich über Apple?“ Der Abfrage-Agent könnte neutrale Unternehmensnachrichten und einige positive Berichte über Apples Lieferkette und die iPhone-Einführungen von großen Medien herausfiltern.
In der Zwischenzeit ist der Medienagent tief in den Kommentaren auf Douyin und Weibo unter iPhone-Zerlegvideos eingetaucht, wo Nutzer über defekte Batterien, Reparaturprobleme und nationalistische Aufrufe, heimische Marken zu kaufen, klagen. Die Stimmung dort ist stark negativ, insbesondere unter jüngeren, technikaffinen Nutzern.
ForumEngine bemerkt die Diskrepanz. Der Moderator LLM stellt den Query Agent in Frage: Sind seine Nachrichtenquellen übermäßig auf offizielle Medien ausgerichtet? Anschließend fragt er den Media Agent, ob die wütenden Kommentare einen breiten Trend oder eine Nischenunterkultur repräsentieren.
Die Agenten reagieren, indem sie mehr Daten abrufen. Der Suchagent erweitert seine Suche, um unabhängige Technologie-Blogs und Benutzerforen einzubeziehen; der Medienagent analysiert zusätzliche Videos und unterschiedliche Regionen. In jeder Runde fasst der Moderator die Übereinstimmungspunkte zusammen und kennzeichnet ungelöste Konflikte.
Erst nach mehreren dieser Zyklen ermöglicht ForumEngine eine Synthese: Zum Beispiel „bleibt die staatlich ausgerichtete Nachrichtenberichterstattung vorsichtig positiv hinsichtlich Apples wirtschaftlicher Rolle, während grassroots Video-Kommentare eine geballte Wut über Batterien und Preisgestaltung zeigen.“
Den Motor antreiben: Der Datenwerfer
Treibstoff für diesen sogenannten Gedankenlese-Engine kommt von einem Schwarm von Crawlern, die leise über mehr als 30 soziale Plattformen streifen. BettaFish richtet seine maßgeschneiderte „Gedanken-Spinne“ auf chinesische Giganten wie Weibo, Douyin und Xiaohongshu, sowie auf Foren, Nachrichtenwebsites und kleinere Apps, die zusammen eine Nutzerbasis von deutlich über 1 Milliarde Menschen repräsentieren. Die Crawler laufen kontinuierlich, nicht auf Abruf, sodass das System stets frische Diskurse verarbeitet.
Jeder Crawler streamt rohe Beiträge, Kommentare und Metadaten in eine Staging-Ebene, bevor irgendetwas ein KI-Modell berührt. Von dort aus reinigen standardisierte Pipelines den Text, normalisieren Zeitstempel und entfernen doppelte virale Reposts, die sonst die Ergebnisse verzerren würden. Erst nach diesem Durchgang landet der Inhalt in einer strukturierten MySQL- oder Postgres-Datenbank, die für sofortige Abfragen bereit ist.
BettaFish behandelt diese Datenbank als seine private Datenquelle. Jede Zeile repräsentiert einen Beitrag mit einer Autoren-ID (in der Regel pseudonym), Plattform, Engagementmetriken und Sprach-Tags. Durch die Vorindizierung dieses Materials kann das System eine neue Anfrage zu „Donald Trump“ oder „Apple-Batterien“ durch SQL-Befehle beantworten, anstatt das Web in Echtzeit zu durchsuchen.
Vor der Speicherung durchläuft jeder Artikel einen Hotness-Klassifikator, der abschätzt, wie viel Aufmerksamkeit ein Beitrag online erhält. Dieser Score vereint Faktoren wie: - Rohaufrufe und Likes - Reposts, Zitat-Tweets und Kommentar-Interaktion - Plattformspezifische Boosts, wie Trendlisten oder Platzierung auf der Startseite
Neben der Hotness weist eine mehrsprachige Sentiment-Analyse-Schicht Polarität und Emotionsetiketten zu. Chinesisch, Englisch und andere Sprachen werden über konfigurierbare LLM oder kleinere Sentiment-Modelle geleitet, die Tags wie „stark negativ“, „sarkastisch“ oder „nationaler Stolz“ erzeugen. Diese Etiketten werden zu erstklassigen Spalten in der Datenbank und nicht zu nachträglich hinzugefügten Annotationen.
Scale verwandelt dies von einem schicken Scraper in eine Infrastruktur. Mit Millionen von Beiträgen, die täglich erfasst und bewertet werden, approximiert BettaFish einen nahezu Echtzeit, abfragbaren Spiegel der öffentlichen Online-Meinung für mehr als 1,4 Milliarden Menschen. Wenn ein Agent später fragt, was chinesische Nutzer über Marvel oder Sojabohnenpreise denken, beginnt er keine Suche; er befragt ein lebendiges, ständig aktualisiertes Datenset.
Eine reale Testfahrt: Stärken und Schwächen
Das Booten von BettaFish in der echten Welt beginnt mit einem gemieteten Hetzner CX31 Server und einer Docker-Compose-Datei. Das Better Stack-Team ruft das GitHub-Repo ab, verbindet es mit OpenRouter für den Zugriff auf LLMs und stellt den Python Flask-Orchestrator bereit. Innerhalb von Minuten läuft ein surveillance-tauglicher Multi-Agenten-Stack auf einem günstigen europäischen VPS.
Für die erste Anfrage gehen sie direkt auf die Geopolitik los: „Was denken die chinesischen Medien wirklich über Donald Trump?“ Dieser einzelne Satz entfaltet sich über den Insight Agent, den Query Agent und den Media Agent, wobei jeder Aufgaben generiert, Fortschritte protokolliert und in die ForumEngine einspeist. Terminalfenster füllen sich in Echtzeit mit Zeitstempeln, SQL-Abfragen und Crawling-Protokollen.
Dann tritt der kritische Fehler auf. Der Media Agent stürzt mit einem eindeutigen Fehler ab: fehlender „Bcker-Websuch-API-Schlüssel“. Dieser Schlüssel erfordert ein verknüpftes WeChat-Konto, eine Hürde, die viele nicht-chinesische Nutzer nicht überwinden können, sodass die gesamte Medienpipeline zum Stillstand kommt. Da der Berichtsgenerator auf alle drei Agenten wartet, kommt der fertige Bericht nie an.
Der Umgehungsmodus tritt in Kraft. Das Team wechselt zum ForumEngine-Ergebnis, kopiert rohe Debattenprotokolle und steckt diese in Gemini 1.5 zur Berichterstellung. Im Hintergrund hat das System weiterhin Daten von über 30 Plattformen abgerufen, eine Sentiment-Analyse durchgeführt und Inhalte nach Heißheitswerten eingestuft, selbst wenn ein Agent versagt hat.
Diese rohen Logs zeigen, was BettaFish gefährlich und faszinierend macht. Unter dem Trump-Geschwätz taucht ein viraler WeChat-Thread auf: „Liebe Tanten und Großmütter, Sojaöl kostet bereits 105 Yuan pro Barrel“, der 987.000 Mal von mittelalten und älteren Nutzern weitergeleitet wurde. Sojapreise, nicht Handelskriege oder die NATO, dominieren einen großen Teil der Trump-bezogenen Stimmung.
Diese Sojabohnen-Fixierung offenbart die wahre Stärke von BettaFish: das Aufspüren nicht offensichtlicher, hyperlokaler Obsessionen im nationalen Maßstab. Die Dokumentation im BettaFish English README – Technische Übersicht und Funktionen macht deutlich, dass dies kein Spielzeug für Sentiment-Analysen ist, sondern ein Radar für öffentliche Meinungen in Industriequalität.
Navigieren im 'verbotenen' rechtlichen Minenfeld
Hier bedeutet "verboten" nicht klassifiziert; es bedeutet rechtlich radioaktiv. BettaFish befindet sich an der Schnittstelle von Überwachungstechnologie, massenhaften Datenerfassungen und grenzüberschreitendem Datenschutzrecht, und fast jeder Teil dieses Stacks verletzt die Regeln von jemandem.
Beginnen Sie mit Scraping. Der Crawler-Cluster von BettaFish durchsucht mehr als 30 Plattformen—darunter Weibo, Douyin und Xiaohongshu—im industriellen Maßstab und speichert Beiträge in MySQL oder Postgres mit Beliebtheitswerten und Stimmungstags. Das geht weit über gelegentliches Browsen hinaus und verstößt gegen die Nutzungsbedingungen der Plattformen, die normalerweise automatisiertes Scraping, Massenverarbeitung und die Wiederverwendung von Inhalten für kommerzielle Analysen verbieten.
Die Geschichte hier ist hässlich. In den USA hat Meta Unternehmen wie BrandTotal und Bright Data verklagt, die Daten scrapen; LinkedIn hat Jahre damit verbracht, gegen HiQ über das automatisierte Scraping von „öffentlichen“ Profilen zu kämpfen. Die Gerichte haben gemischte Signale gesendet, aber die Botschaft der Plattformen ist klar: großangelegtes Scraping, insbesondere zur Profilierung, zieht Abmahnungen, IP-Sperrungen und potenziell Argumente gemäß dem Computer Fraud and Abuse Act nach sich, wenn man technische Barrieren ignoriert.
Das Datenschutzrecht erhöht die Einsätze noch weiter. BettaFish aggregiert nominal öffentliche Beiträge zu umfangreichen Verhaltensprofilen und führt dann Sentiment-Analysen und Themenclustering durch, um Einstellungen, Ängste und Loyalitäten abzuleiten. Unter Chinas Gesetz über den Schutz persönlicher Informationen (PIPL) und Europas DSGVO beginnt das wie eine großangelegte Profilerstellung und "Sonderkategorie"-Inferenz auszusehen, oft ohne ausdrückliche Zustimmung oder klare rechtliche Grundlage.
Regulierungsbehörden betrachten "öffentlich" zunehmend nicht als Freibrief. GDPR-Fälle gegen Clearview AI haben gezeigt, dass das Scrapen von Inhalten aus dem öffentlichen Internet zum Aufbau von Gesichtserkennungsdatenbanken rechtswidrig sein kann. Eine BettaFish-Implementierung, die sich an EU-Nutzer richtet, könnte Pflichten auslösen für: - Rechtmäßige Grundlage für die Verarbeitung - Datenschutz-Folgenabschätzungen - Zugriffs- und Löschrechte für betroffene Personen
Missbrauchsrisiko ist der Punkt, an dem das Etikett „verbotenes Gedankenlesen“ nicht mehr nach Hype klingt. Ein System, das emotionale Auslöser bei Millionen von Nutzern erfasst, kann Desinformationskampagnen optimieren, Propagandaanalysen in Echtzeit A/B testen oder Empörung gezielt auf spezifische Demografien ausrichten. Regierungen und politische Beratungsunternehmen bezahlen bereits für wesentlich rudimentärere Dashboards.
Unternehmen könnten BettaFish heimlich in interne Datensätze für wirtschaftlichen Geheimdienst integrieren, um die Stimmung der Mitarbeiter, die Organisierung von Gewerkschaften oder Gespräche von Whistleblowern zu verfolgen. Kombiniert mit „privaten Datenbanken“ und Echtzeitüberwachung kann dasselbe System, das erklärt, was chinesische Tanten über Sojaöl denken, auch Dissidenten kennzeichnen, Boykott-Organisatoren identifizieren oder Aktivisten unter Druck setzen, bevor sie in den Trend kommen.
Jenseits von China: Globale Chancen und Risiken
Wenn BettaFish in westliche sozialen Medien auftaucht, würde es aufhören, eine Neugier von etwa 1,4 Milliarden Menschen zu sein und stattdessen wie ein schlüsselfertiges Meinungsnetz aussehen. Tauschen Sie Weibo und Douyin gegen X, Reddit, Facebook, YouTube, Instagram und TikTok aus, und derselbe Crawler-Stack könnte Millionen von Beiträgen pro Stunde einsammeln, sie nach Geografie, Ideologie oder Gemeinschaft taggen und in denselben Multi-Agenten-Debattenzyklus einspeisen. Mit OpenAI, Anthropic oder lokalen LLMs eingesetzt, erhalten Sie eine nahezu in Echtzeit stattfindende Synthese dessen, was ein Ausschnitt des Internets „wirklich denkt“ über Gaza, Taylor Swift oder den S&P 500.
Für legale Spieler ist das wie Katzenminze. Ein Hedgefonds könnte BettaFish in Reddit’s r/wallstreetbets, X Finance und YouTube-Finanzinfluencer einspeisen, um die Dynamik von Meme-Aktien zu quantifizieren, bevor sie in Bloomberg-Terminals auftaucht. Gesundheitsbehörden könnten Anstiege bei „Brustschmerzen nach dem Laufen“, „Ozempic-Nebenwirkungen“ oder Impfgegnerthemen in Facebook-Gruppen und Telegram-Kanälen überwachen und dann Interventionen Tage früher planen. Marken zahlen bereits sechsstellige Beträge für Social Listening; ein ausgereifter BettaFish-Fork könnte ihnen eine detaillierte Reputationsüberwachung in verschiedenen Sprachen, Subkulturen und Randplattformen zum Preis von Cloud-GPUs und einer DevOps-Anstellung bieten.
Die gleichen Mechanismen werden in der westlichen Politik schnell hässlich. Sobald ein solches Werkzeug Open Source ist, kann jede Kampagne, PAC oder ausländische Einflussnahme rund um die Uhr narrative Aufklärung betreiben: welche Argumente in den Vororten von Michigan ankommen, welche Verschwörungshashtags kurz davor sind, in Brasilien auszubrechen, welche Influencer-Gruppen sich für Einwanderung oder Transrechte einsetzen. Kombiniert mit billigen Content-Farmen und Werbe-APIs erhält man automatisierte Feedback-Loops, die Propaganda öffentlich A/B testen und dann nur das verstärken, was am meisten polarisiert.
BettaFish zeigt, wie schwer es ist, duale KI einzudämmen. Der Code ist auf GitHub, bereits zigtausendmal favorisiert, und nichts hält Forks, die auf die Politik der USA, der EU oder Indiens abgestimmt sind, davon ab, sich über private Repositories und Discord-Server auszubreiten. Man kann ein Multi-Agenten-Überwachungsanalyse-System nicht sinnvoll „zurückrufen“, sobald es existiert; man kann nur versuchen, Normen, Regelungen und Gegenwerkzeuge zu entwickeln, bevor der nächste Student eine noch schärfere Version veröffentlicht.
Die paradoxale Vision des Schöpfers
Der Schöpfer von BettaFish präsentiert es nicht als Waffe. Er spricht von einem System, das „aus Echokammern ausbrechen“ kann, indem es eine „wirkliche Sentiment-Landschaft“ über Plattformen hinweg kartiert und Millionen von Beiträgen analysiert, um aufzuzeigen, worüber 1,4 Milliarden Menschen tatsächlich diskutieren, nicht nur darüber, was Staatsmedien oder virale Aufregungsstränge verstärken. In seiner Darstellung bedeuten mehr Daten und mehr Nuancen mehr Wahrheit.
Dieser Idealismus erstreckt sich auch auf die offizielle Roadmap. Zukünftige Versionen versprechen Graph-Neuronale-Netzwerke, die Beziehungen zwischen Nutzern, Themen und Erzählungen modellieren, sowie Zeitreihen-Pipelines, die diese Grafiken über Tage oder Monate hinweg verfolgen. Das Ziel: nicht nur zu beschreiben, was die chinesischen sozialen Medien heute über Donald Trump oder Apple denken, sondern vorherzusagen, wohin sich die Stimmung als Nächstes bewegen wird.
Roadmap-Notizen sprechen über die Kombination von: - plattformübergreifenden sozialen Graphen - historischen „Beliebtheits“-Bewertungen und Stimmungskurven - externen Signalen wie Nachrichtenzyklen oder politischen Ereignissen
Gemeinsam würden diese Inputs BettaFish ermöglichen, Simulationen von Meinungswellen durchzuführen – wer wen beeinflusst, wie schnell Empörung abbaut und welche demografischen Gruppen zuerst umschlagen.
Diese gleiche Architektur sieht auch indistinguierbar aus wie eine Massenüberwachungs- und psychologische Profiling-Engine. Ein System, das Benutzer in Einflussgrafiken gruppiert, sie nach Stimmung kennzeichnet und ihre zukünftigen Reaktionen vorhersagt, beschreibt nicht nur eine Bevölkerung; es schafft eine Zielmatrix für Werbetreibende, politische Akteure oder Sicherheitsagenturen. Dokumentationen und Erklärungen wie BettaFish (WeiYu) – Tiefgehende Einführung in die Open-Source-Öffentlichkeitsplattform stellen dies als analytische Macht dar, aber die Grenze zwischen „Analyse“ und „Kontrolle“ schrumpft, je besser die Vorhersage wird.
Das Projekt steht also vor einem Paradox. Um tatsächlich "Echokammern zu durchbrechen", muss BettaFish alles sehen, alles erinnern und jeden modellieren, was fast garantiert Kollateralschäden an der Privatsphäre und an digitalen Rechten zur Folge hat. Die offene Frage ist, ob ein so detailliertes Werkzeug zur öffentlichen Meinungsbildung ein Instrument der Transparenz bleiben kann, sobald Staaten, Plattformen oder böswillige Akteure sich daran anschließen.
Das zweischneidige Schwert auf Ihrem Server
Macht liegt unbehaglich nah bei jedem, der `docker compose up` ausführen kann. BettaFish verwandelt einen Mid-Range Hetzner-Server in ein überwachungsfähiges Stimmungsradar, das leise Weibo, Douyin, Xiaohongshu und Dutzende andere Plattformen durchforstet und dann Millionen von Beiträgen zu ausgefeilten Berichten über das, was 1,4 Milliarden Menschen angeblich „wirklich denken“, zusammenführt.
Diese Reichweite hat einen Haken, der direkt im README verankert ist. Unter dem Hype verbergen sich klare Haftungsausschlüsse: Der Autor distanziert sich von jeglichem Missbrauch, und jede rechtliche und ethische Konsequenz trifft denjenigen, der diesen Code tatsächlich einsetzt. Mit anderen Worten, BettaFish ist kostenlos, aber die Haftung ist vollständig privatisiert.
Diese Warnungen sind nicht akademisch. Kontinuierliches Scraping, plattformübergreifende Verknüpfung und das Tracking von Echtzeit-Trends kollidieren mit Chinas Gesetz zum Schutz persönlicher Informationen und ähnlichen Datenschutzregeln anderswo. Wenn Sie dieses System gegen Twitter (X), Reddit, Facebook oder YouTube einsetzen, betreiben Sie plötzlich eine selbstentwickelte Social Listening-Plattform im Maßstab, der normalerweise Werbetechnologiegiganten und Geheimdiensten vorbehalten ist.
Was BettaFish unheimlich macht, ist nicht, dass es einzigartig böse ist, sondern dass es ungewöhnlich ehrlich darüber ist, was moderne KI leisten kann. Debatten zwischen mehreren Agenten, automatisierte SQL-Generierung und ein Crawler-Cluster, der eine einzige Sentiment-Datenbank speist, sind genau die Methoden, mit denen kommerzielle Werkzeuge zur Überwachung von Ruf und politischer Beratung bereits funktionieren - nur hinter Zahlungswällen und Geheimhaltungsverträgen, anstatt auf GitHub-Stars und Docker-Hub-Downloads.
Die Frage ist also nicht mehr: „Ist dieses Tool gut oder schlecht?“, sondern „Wer darf das tun und nach welchen Regeln?“ Ein Regierungsministerium, ein Hedgefonds, eine Trollfabrik und ein einzelner Doktorand haben jetzt Zugriff auf mehr oder weniger die gleichen Fähigkeiten: sammeln, clustern, analysieren und in nahezu Echtzeit die öffentliche Meinung vorhersagen, und das zu fast null Grenzkosten.
BettaFish kristallisiert die aktuelle KI-Ära in einer einzigen Befehlszeilenentscheidung. Sie können es forks, OpenRouter integrieren, es auf Ihre Lieblingsplattformen ausrichten und die Berichte hereinfließen sehen. Bevor Sie das tun, fragen Sie sich: In einer Zeit, in der Open-Source-Code die Crowd auf planetarischer Ebene erfassen kann, wo ziehen Sie die Grenze zwischen Erkenntnis und Eindringen?
Häufig gestellte Fragen
Was ist BettaFish KI?
BettaFish (Weiyu) ist ein Open-Source-Multi-Agenten-KI-System, das entwickelt wurde, um die öffentliche Meinung zu analysieren, indem es Daten von sozialen Medien sammelt. Dabei verwenden verschiedene KI-Agenten, um die Informationen zu verarbeiten, Ergebnisse zu diskutieren und umfassende Berichte zu erstellen.
Wie funktioniert BettaFish?
Es verwendet einen Crawler, um soziale Medien zu durchsuchen, und setzt dann mehrere KI-Agenten parallel ein: einen Abfrage-Agenten für Webnachrichten, einen Medien-Agenten für Bilder/Videos und einen Insight-Agenten für private Daten. Ein einzigartiger 'ForumEngine' lässt diese Agenten ihre Erkenntnisse diskutieren, bevor ein Report-Agent die endgültige Ausgabe synthetisiert.
Ist es legal, Bettafische zu verwenden?
Die Nutzung von BettaFish befindet sich in einem rechtlichen Graubereich. Die Web-Scraping-Funktionalität könnte gegen die Nutzungsbedingungen vieler sozialer Medien verstoßen und möglicherweise gegen Datenschutzgesetze (wie die DSGVO oder Chinas PIPL) verstoßen, je nachdem, wie und wo es verwendet wird. Die GitHub-Seite des Projekts enthält Haftungsausschlüsse, die die Benutzer auffordern, die lokalen Gesetze einzuhalten.
Welche sozialen Medienplattformen kann BettaFish analysieren?
BettaFish ist hauptsächlich darauf ausgelegt, große chinesische Social-Media-Plattformen wie Weibo, Douyin (TikTok China), Xiaohongshu und Zhihu zu analysieren. Allerdings ist seine Architektur erweiterbar und könnte potenziell angepasst werden, um andere globale Plattformen wie Twitter (X), Reddit oder YouTube zu durchsuchen.