Am Donnerstag gab die Wikimedia Foundation Lizenzvereinbarungen mit Microsoft, Meta, Amazon, Perplexity und Mistral AI bekannt und formalisierte damit ein System, in dem große Technologieunternehmen die gemeinnützige Organisation für die Nutzung von Wikipedia-Inhalten zum Trainieren ihrer Modelle für künstliche Intelligenz entschädigen. Diese Modelle treiben KI-Assistenten wie Microsoft Copilot und OpenAIs ChatGPT an.
Die Vereinbarungen stellen eine bedeutende Abkehr von der bisherigen Praxis dar, bei der diese Unternehmen Wikipedia ohne ausdrückliche Genehmigung nach Daten durchsuchten. Mit diesen Vereinbarungen sind die meisten großen KI-Entwickler dem Wikimedia Enterprise-Programm beigetreten, einer kommerziellen Tochtergesellschaft, die API-Zugriff auf die umfangreiche Datenbank von Wikipedia mit 65 Millionen Artikeln bietet. Dieser Zugriff ermöglicht höhere Geschwindigkeiten und Datenmengen im Vergleich zu den kostenlosen, öffentlichen APIs. Die Wikimedia Foundation hat die konkreten finanziellen Bedingungen dieser neuen Partnerschaften nicht offengelegt.
Diese neuen Partner gesellen sich zu Google, das bereits 2022 eine ähnliche Vereinbarung mit Wikimedia Enterprise getroffen hat, sowie zu kleineren Unternehmen wie Ecosia, Nomic, Pleias, ProRata und Reef Media. Die Einnahmen aus diesen Lizenzvereinbarungen sollen dazu beitragen, die beträchtlichen Infrastrukturkosten zu decken, die mit der Wartung von Wikipedia verbunden sind. Die gemeinnützige Organisation ist hauptsächlich auf kleine öffentliche Spenden angewiesen, während ihre Inhalte zu einer wichtigen Ressource für das Training von KI-Modellen geworden sind.
Die Nutzung von Wikipedia-Inhalten im KI-Training verdeutlicht die komplexe Beziehung zwischen Open-Source-Wissen und dem sich schnell entwickelnden Bereich der künstlichen Intelligenz. KI-Modelle, insbesondere große Sprachmodelle (LLMs), benötigen riesige Datensätze, um zu lernen und menschenähnlichen Text zu generieren. Wikipedia mit seiner riesigen und gemeinschaftlich bearbeiteten Sammlung von Artikeln ist zu einer unschätzbaren Informationsquelle für diese Modelle geworden.
Die Lizenzvereinbarungen werfen wichtige Fragen zu den ethischen und wirtschaftlichen Auswirkungen der Nutzung öffentlich zugänglicher Daten zum Trainieren kommerzieller KI-Systeme auf. Während Wikipedia von den Einnahmen aus diesen Vereinbarungen profitiert, bleiben die umfassenderen Auswirkungen auf die Zukunft des offenen Wissens und der KI-Entwicklung abzuwarten. Der Schritt der Wikimedia Foundation, den Zugang zu ihren Daten zu monetarisieren, spiegelt einen wachsenden Trend unter den Urhebern von Inhalten wider, die eine Entschädigung für die Nutzung ihrer Arbeit in der KI-Industrie fordern. Die laufenden Entwicklungen in diesem Bereich könnten die Landschaft des KI-Trainings und des Datenzugriffs in den kommenden Jahren potenziell verändern.
Discussion
Join the conversation
Be the first to comment