Казус от практиката: Модериране на съдържание
30K+ уеб документа са бракувани и пояснени за модериране на съдържанието
които се стремят да осигурят онлайн пространството, където се свързваме и комуникираме.
Тъй като използването на социални медии продължава да расте,
проблемът с кибертормоза изплува като a
значително препятствие за платформите, които се стремят към
осигурете сигурно онлайн пространство. Зашеметяване
38% от хората се сблъскват с това
вредно поведение на ежедневна база,
подчертавайки спешното търсене на изобретателство
подходи за модериране на съдържанието.
Организациите днес разчитат на използването на
изкуствен интелект за справяне с трайните
проблемът с кибертормоза проактивно.
Кибер защита:
Докладът за прилагане на стандартите на общността на Facebook за четвъртото тримесечие на Facebook разкри – действие срещу 4 милиона парчета съдържание за малтретиране и тормоз, с процент на проактивно откриване от 6.3%
Образование:
A 2021 проучване установи, че 36.5%% от учениците в Съединените щати на възраст между 12 & 17 години са преживели кибертормоз в един или друг момент по време на своето обучение.
Според доклад от 2020 г. глобалният пазар на решения за модериране на съдържание е оценен на 4.07 милиарда USD през 2019 г. и се очаква да достигне 11.94 милиарда USD до 2027 г. с CAGR от 14.7%.
Реален свят Решение
Данни, които модерират глобалните разговори
Клиентът разработваше стабилен автоматизиран
модериране на съдържание Машинно обучение
модел за своето облачно предложение, за което те
търсеха специфичен за домейн доставчик, който
може да им помогне с точни данни за обучение.
Използвайки обширните си познания в обработката на естествения език (NLP), ние помогнахме на клиента да събере, категоризира и анотира повече от 30,000 XNUMX документа както на английски, така и на испански, за да изгради автоматизиран модел за машинно обучение за модериране на съдържание, раздвоен на токсично, пълнолетно или сексуално открито съдържание категории.
Проблем
- Уеб копиране на 30,000 XNUMX документа на испански и английски от приоритетни домейни
- Категоризиране на събраното съдържание в кратки, средни и дълги сегменти
- Етикетиране на събраните данни като токсично, пълнолетно или открито сексуално съдържание
- Осигуряване на висококачествени анотации с минимум 90% точност.
Решение
- Уеб Бракувани 30,000 XNUMX документа всеки за испански и английски от BFSI, Healthcare, Manufacturing, Retail. Съдържанието беше допълнително разделено на кратки, средни и дълги документи
- Успешното етикетиране на съдържанието е класифицирано като токсично, пълнолетно или открито сексуално съдържание
- За да постигне 90% качество, Shaip внедри процес на контрол на качеството на две нива:
» Ниво 1: Проверка за осигуряване на качеството: 100% от файловете трябва да бъдат валидирани.
» Ниво 2: Проверка на критичен анализ на качеството: CQA екипът на Shaips за оценка на 15%-20% от ретроспективните проби.
Резултат
Данните от обучението помогнаха за изграждането на автоматизиран ML модел за модериране на съдържание, който може да доведе до няколко резултата, полезни за поддържането на по-безопасна онлайн среда. Някои от ключовите резултати включват:
- Ефективност за обработка на огромно количество данни
- Последователност при осигуряване на еднакво прилагане на политиките за модериране
- Мащабируемост за адаптиране към нарастваща потребителска база и обеми на съдържание
- Модерирането в реално време може да идентифицира &
премахване на потенциално вредно съдържание, докато се генерира - Рентабилност чрез намаляване на зависимостта от човешки модератори
Примери за модериране на съдържание
Кажете ни как можем да помогнем при следващата ви инициатива за изкуствен интелект.