Социалната мрежа Reddit заведе дело срещу стартъпът за изкуствен интелект Perplexity и три компании за събиране на данни. Целта ѝ е да спре „индустриалното и незаконно заобикаляне на защитата на данните“, с което се постига придобиване на защитено съдържание от Reddit без разрешение.

В иска си Reddit сравнява компаниите SerpApi, Oxylabs и AWMProxy с „опити за обир на банки“, които, знаейки, че не могат да влязат в трезора, атакуват бронирания камион с пари. Perplexity е обвинена, че е клиент на поне една от тези компании и „ще направи всичко, за да получи данните от Reddit за своя „отговорен механизъм“, вместо да сключи легално споразумение с платформата, както са направили някои конкуренти“.

През май 2024 г. Reddit изпрати предупреждение до Perplexity да спре събирането на данни. Въпреки уверенията на Perplexity, че не използва съдържанието на Reddit за обучение на AI и ще спазва robots.txt, след това цитатите от Reddit в Perplexity дори се увеличили. Дори пост, достъпен само за Google, бил „произведен“ от Perplexity в рамките на няколко часа, според Reddit. Компанията твърди, че Perplexity е получила данните чрез събиране от Google SERP и бързо ги е интегрирала в своя AI механизъм.
Бен Лий, главен юридически директор на Reddit, посочва, че индустрията за AI води състезание за качествено човешко съдържание, което е създало „икономика за пране на данни“. Събирачите заобикалят защитите, крадат данни и ги продават на компании, нуждаещи се от обучителен материал. Reddit е особено ценна цел заради огромния си и динамичен обем от човешки разговори.

Лий допълва, че подсъдимите компании маскират идентичността си, скриват местоположението си и прикриват инструментите си, за да откраднат съдържание от Google Search. Perplexity е обвинена, че умишлено купува тези откраднати данни вместо да сключи законно споразумение с Reddit.
От Perplexity заявяват, че все още не са получили иска, но „ще се борят за правата на потребителите да имат свободен и справедлив достъп до публични знания“ и че „подходът им остава принципен и отговорен, като предоставят точни отговори с надежден AI, без да толерират заплахи срещу откритостта и обществения интерес“.
Източник: Banker.bg