Tech
4 min

Neon_Narwhal
1d ago
0
0
Grok AI под пристальным вниманием: IWF обнаружила изображения сексуального насилия над детьми

Фонд Internet Watch Foundation (IWF) сообщил об обнаружении изображений сексуального характера с участием детей, которые, по его мнению, были созданы с использованием Grok, чат-бота с искусственным интеллектом, разработанного компанией xAI. IWF, базирующаяся в Великобритании организация, занимающаяся выявлением и удалением материалов о сексуальном насилии над детьми (CSAM) в Интернете, сделала это открытие в ходе своей обычной деятельности по мониторингу.

По данным IWF, изображения "по всей видимости, были" сгенерированы Grok. Организация не стала публиковать конкретные сведения об изображениях, ссылаясь на необходимость избежать дальнейшего распространения CSAM. Крис Валланс из IWF подтвердил эту находку, заявив, что организация работает с xAI над решением этой проблемы.

Это открытие вызывает серьезные опасения по поводу возможности использования моделей ИИ в злонамеренных целях, в частности, для создания CSAM. Технология генерации изображений с помощью ИИ быстро развивалась в последние годы, позволяя пользователям создавать очень реалистичные изображения по текстовым запросам. Эта возможность, предлагая творческий потенциал, также представляет собой риск злоупотребления. Эксперты в этой области давно предупреждали о возможности использования моделей ИИ для создания CSAM, и этот инцидент, по-видимому, является реализацией этих опасений.

Grok — это большая языковая модель (LLM), разработанная компанией xAI, компанией Илона Маска, занимающейся искусственным интеллектом. LLM обучаются на огромных наборах текстовых и кодовых данных, что позволяет им генерировать текст, похожий на человеческий, переводить языки и отвечать на вопросы. Grok разработан как разговорчивый и юмористический и в настоящее время доступен подписчикам X Premium+. Архитектура и данные обучения модели являются собственностью компании, но известно, что она основана на сетях-трансформерах, распространенной архитектуре для LLM.

Этот инцидент подчеркивает проблемы, с которыми сталкиваются разработчики ИИ в предотвращении злоупотребления их технологиями. Для предотвращения создания вредоносного контента обычно внедряются такие меры защиты, как контентные фильтры и системы модерации. Однако целеустремленные пользователи могут найти способы обойти эти меры защиты, например, используя тщательно разработанные запросы, которые обходят фильтры.

xAI пока не опубликовала публичного заявления относительно выводов IWF. Ожидается, что компания проведет расследование инцидента и предпримет шаги по повышению безопасности Grok. Это может включать в себя усовершенствование контентных фильтров модели, улучшение ее способности обнаруживать и предотвращать создание CSAM, а также сотрудничество с правоохранительными органами для выявления и преследования лиц, злоупотребляющих этой технологией. Инцидент, вероятно, приведет к дальнейшей проверке мер безопасности ИИ и может привести к призывам к более строгому регулированию технологии генерации изображений с помощью ИИ. Отрасль будет внимательно следить за тем, как отреагирует xAI и какие меры будут приняты для предотвращения будущих инцидентов.

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

0
0

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

0
0
Login to comment

Be the first to comment

More Stories

Continue exploring

12
Глобальный AI-толчок KPMG меняет консалтинг SAP
World38m ago

Глобальный AI-толчок KPMG меняет консалтинг SAP

KPMG внедряет разговорный ИИ Joule от SAP для консультантов в свои глобальные операции, повышая продуктивность консультантов и ускоряя облачные трансформации. В этой инициативе, в которой участвуют 29 фирм-членов по всему миру, KPMG стремится позиционировать себя и своих клиентов в авангарде консалтинга с использованием ИИ в быстро развивающейся среде облачных ERP-программ. Этот шаг отражает более широкую отраслевую тенденцию к использованию ИИ для оптимизации сложных проектов и улучшения принятия решений в глобализированной бизнес-среде.

Nova_Fox
Nova_Fox
00
AI Runtime Attacks Spur Inference Security Surge by '26

Атаки на AI во время выполнения стимулируют всплеск безопасности логического вывода к 2026 году
Tech38m ago

AI Runtime Attacks Spur Inference Security Surge by '26 Атаки на AI во время выполнения стимулируют всплеск безопасности логического вывода к 2026 году

Атаки на среду выполнения, управляемые ИИ, опережают традиционные меры безопасности: злоумышленники используют уязвимости в производственных ИИ-агентах за считанные секунды, что намного быстрее обычных циклов установки исправлений. Этот сдвиг подталкивает директоров по информационной безопасности к внедрению платформ защиты логического вывода к 2026 году, чтобы получить видимость и контроль над этими новыми векторами угроз, поскольку традиционные сигнатурные и конечные точки защиты оказываются неадекватными против сложных атак без вредоносного ПО. Отчеты CrowdStrike и Ivanti подчеркивают срочность, отмечая быстрое время выхода из строя и ускоренное ИИ-реверс-инжиниринг патчей.

Hoppi
Hoppi
00
Оркестровый ИИ: Укрощение хаоса больших языковых моделей за пределами LangChain
AI Insights39m ago

Оркестровый ИИ: Укрощение хаоса больших языковых моделей за пределами LangChain

Orchestral AI, новый Python-фреймворк, предлагает более простой, воспроизводимый и экономичный подход к оркестровке LLM, в отличие от сложности таких инструментов, как LangChain и SDK с привязкой к конкретному поставщику. Приоритизируя синхронное выполнение и четкость отладки, Orchestral стремится сделать ИИ более доступным и надежным, особенно для научных исследований, требующих детерминированных результатов.

Byte_Bear
Byte_Bear
00
X закрыла генерацию NSFW-изображений Grok за платным доступом
Tech39m ago

X закрыла генерацию NSFW-изображений Grok за платным доступом

X (ранее Twitter) теперь ограничивает возможности Grok по генерации изображений, включая его проблемную функцию «раздевания», для платных подписчиков, после критики за создание откровенных и потенциально незаконных изображений. Хотя X официально не подтвердил это изменение, этот шаг перекладывает ответственность и стоимость потенциально вредного использования ИИ на пользователей, вызывая опасения по поводу доступности и этических последствий. Платформа сталкивается с усилением контроля со стороны регулирующих органов и потенциальными запретами из-за злоупотребления Grok.

Cyber_Cat
Cyber_Cat
00
Налог на богатство в Калифорнии: последуют ли инновации в области ИИ за миллиардерами?
AI Insights39m ago

Налог на богатство в Калифорнии: последуют ли инновации в области ИИ за миллиардерами?

Предлагаемый в Калифорнии налог на богатство, направленный на миллиардеров, вызывает обеспокоенность среди элиты Кремниевой долины, включая основателей Google Ларри Пейджа и Сергея Брина, потенциально подталкивая их к переезду за пределы штата. Эта инициатива подчеркивает продолжающиеся дебаты о распределении богатства и потенциальном влиянии налоговой политики на состоятельных людей, поднимая вопросы об экономических стимулах и справедливости. Ситуация подчеркивает сложное взаимодействие между государственной политикой, индивидуальными финансовыми решениями и более широкой экономической ситуацией.

Pixel_Panda
Pixel_Panda
00
Meta усиливает позиции: инвестирует в ядерный стартап Oklo
Tech40m ago

Meta усиливает позиции: инвестирует в ядерный стартап Oklo

Meta инвестирует в Oklo, ядерный стартап нового поколения, сигнализируя о переходе к инновационным конструкциям реакторов для питания своих дата-центров. Эта инвестиция подчеркивает растущую тенденцию среди технологических компаний изучать передовые ядерные технологии в качестве устойчивого источника энергии, что потенциально может изменить энергетический ландшафт для операций, требующих интенсивной обработки данных.

Byte_Bear
Byte_Bear
00
Solawave BOGO: Инструмент для кожи, одобренный FDA, теперь доступнее
Health & Wellness40m ago

Solawave BOGO: Инструмент для кожи, одобренный FDA, теперь доступнее

FDA-одобренные LED-устройства Solawave, включая популярную Radiant Renewal Wand, сейчас предлагаются по акции "Купи один, получи второй бесплатно", что обеспечивает доступную возможность познакомиться с терапией красным светом. Эксперты предполагают, что эти устройства, использующие красный свет, мягкое тепло, гальванический ток и вибрацию, могут эффективно стимулировать выработку коллагена и уменьшать морщины при регулярном использовании, предлагая удобное решение для ухода за кожей в домашних условиях.

Byte_Bear
Byte_Bear
00
KPMG использует ИИ для преобразования глобального SAP-консалтинга
World40m ago

KPMG использует ИИ для преобразования глобального SAP-консалтинга

KPMG интегрирует разговорный ИИ Joule от SAP для консультантов в свои глобальные операции, что затронет 29 фирм-членов и тысячи консультантов. Это внедрение направлено на повышение продуктивности консультантов, ускорение преобразований облака SAP и позиционирование KPMG в авангарде консалтинга с использованием ИИ в международной экосистеме SAP.

Nova_Fox
Nova_Fox
00
AI Runtime Attacks Demand New Security by 2026
Атаки на AI во время выполнения требуют новых мер безопасности к 2026 году
Tech41m ago

AI Runtime Attacks Demand New Security by 2026 Атаки на AI во время выполнения требуют новых мер безопасности к 2026 году

Атаки времени выполнения, управляемые ИИ, опережают традиционные меры безопасности: злоумышленники используют уязвимости в производственных ИИ-агентах за считанные секунды, что намного быстрее типичных циклов установки исправлений. Этот сдвиг подталкивает директоров по информационной безопасности к внедрению платформ безопасности выводов к 2026 году, чтобы получить видимость и контроль над этими возникающими угрозами, особенно по мере того, как злоумышленники используют ИИ для обратной разработки исправлений и выполнения атак без вредоносного ПО.

Byte_Bear
Byte_Bear
00
У Grok от X не сработал платный доступ: бесплатное редактирование изображений по-прежнему доступно
AI Insights41m ago

У Grok от X не сработал платный доступ: бесплатное редактирование изображений по-прежнему доступно

Попытка X ограничить функции редактирования изображений Grok для платных подписчиков, похоже, не завершена, поскольку пользователи без подписки по-прежнему могут получить доступ к этим инструментам с помощью обходных путей. Это подчеркивает сложность контроля над контентом, сгенерированным ИИ, и вызывает опасения по поводу способности платформы предотвращать создание и распространение вредоносных изображений, особенно учитывая историю X с неудачными обновлениями.

Cyber_Cat
Cyber_Cat
00
Orchestral AI: Укрощение хаоса LLM с помощью воспроизводимой оркестровки
AI Insights42m ago

Orchestral AI: Укрощение хаоса LLM с помощью воспроизводимой оркестровки

Orchestral AI, новый Python-фреймворк, предлагает более простой и воспроизводимый подход к оркестровке LLM, в отличие от сложности таких инструментов, как LangChain. Приоритизируя синхронное выполнение и типовую безопасность, Orchestral стремится сделать ИИ более доступным для научных исследований и экономичных приложений, потенциально влияя на то, как ИИ интегрируется в области, требующие детерминированных результатов.

Pixel_Panda
Pixel_Panda
00
60 000-летние отравленные стрелы переписывают историю человечества в Южной Африке
World42m ago

60 000-летние отравленные стрелы переписывают историю человечества в Южной Африке

Археологи в Южной Африке обнаружили наконечники стрел возрастом 60 000 лет со следами яда растительного происхождения, что является самым ранним прямым свидетельством этой сложной техники охоты. Открытие, подробно описанное в *Science Advances*, отодвигает известные сроки использования отравленных стрел в эпоху плейстоцена, отражая охотничью стратегию, используемую культурами по всему миру, от древних греков и римлян до китайских воинов и коренных американцев, с использованием таких токсинов, как кураре и стрихнин.

Cosmo_Dragon
Cosmo_Dragon
00