Мета со модел на ВИ за превод и транскрипција на говор на десетици јазици

SeamlessM4T поддржува преводи на текст и говор на речиси сто јазици, како и целосен превод од говор во говор за 35 јазици, комбинирајќи ја технологијата која претходно беше достапна само во посебни модели

Матичната компанија на Фејсбук, Мета платформи, во вторникот објави модел на вештачка интелигенција способен за превод и транскрипција на десетици јазици, што е потенцијална основа за алатки кои овозможуваат комуникација во реално време премостувајќи ги јазичните поделби.

Ваквите поделби претставуваат јаз меѓу различните јазици во однос на нивната функционална одржливост и присуство на интернет.

Компанијата на својот блог објави пост дека нејзиниот модел SeamlessM4T поддржува преводи на текст и говор на речиси сто јазици, како и целосен превод од говор во говор за 35 јазици, комбинирајќи ја технологијата која претходно беше достапна само во посебни модели.

Извршниот директор на Мета, Марк Закерберг, рече дека има визија за алатки кои ги олеснуваат интеракциите меѓу корисниците од целиот свет во метаверзумот. Во постот се наведува и дека Мета го става својот модел достапен на јавноста за некомерцијална употреба.

Најголемата светска компанија за социјални медиуми годинава објави голем број на главно бесплатни модели со вештачка интелигенција.

Меѓу нив е и големиот јазичен модел наречен LLaMA (Large Language Model Meta AI), дизајниран да им помогне на истражувачите на вештачката интелигенција да ја унапредат својата работа на ова поле.

Закерберг вели дека отворениот екосистем за вештачка интелигенција работи во полза на Мета, имајќи предвид дека компанијата добива повеќе со ефикасен „crowd sorurcing“ за создавање алатки погодни за корисниците за своите социјални платформи, отколку со наплата за пристап до моделите. И покрај ова, Мета се соочува со слични правни проблеми како и остатокот од индустријата кога податоците за обука се внесуваат во моделот.

Во јули, стенд-ап комичарката Сара Силверман и уште двајца автори поднесоа тужби за прекршување на авторските права против Мета и OпенАИ, обвинувајќи ги за неовластена употреба на нивната содржина за обука на јазици за вештачка интелигенција. Содржината беше заштитена со авторски права и користена од Мета и OпенАИ за обука на чет-ботови.

Кога станува збор за моделот SeamlessM4T, истражувачите на Мета тврдат во нивниот истражувачки труд дека собрале податоци за аудио инструкции од четири милиони часа „сурово аудио кое потекнува од јавно достапно складиште на индексирани податоци на Интернет“, но не прецизирале за кое складиште се работи.

Портпаролот на Мета не одговори на прашањата за потеклото на аудио податоците. Во нивната истражувачка работа се наведува и дека текстуалните податоци потекнуваат од множества на податоци кои биле креирани минатата година, а содржините ги извлекле од Википедија и слични веб-страници.