pornhub
Наверх

Искусственный интеллект

172042Творчество с искусственным интеллектом: как преобразовать текст в картину
20.12.2021
17:34
Творчество с искусственным интеллектом: как преобразовать текст в картину
Модели на основе нейросетей искусственного интеллекта, преобразующие текст в изображение, не новы. Однако ранее это были в основном коммерческие (Artbreeder) или научные модели (DALL-E и VQGAN+CLIP). На днях в открытом доступе появилось бесплатное приложение Dream by Wombo, которое генерирует стилизованные изображения на основе краткого текстового описания и выбранного стиля. Особенностью Dream является высокая скорость работы, возможность выбора стиля изображения и его доступность. Приложение открыто для скачивания в Apple AppStore и Google Play Market, а также как веб-приложение. ПО разработано канадским стартапом Wombo. Ранее компания выпустила приложение для создания липсинков по статическим изображениям людей. В нем генерируется анимация лица, мимика и положение рта, которые синхронизированы с текстами известных песен. На текущий момент Dream поддерживает такие стили изображений, как «мистический», «психоделический», «стимпанк» и другие. Источник: Neurohive
171814Canon представила фотокамеру EOS R3 с искусственным интеллектом
15.12.2021
12:00
Canon представила фотокамеру EOS R3 с искусственным интеллектом
Фотокамера Canon EOS R3 ориентирована прежде всего на профессиональную спортивную и репортажную съемку. В линейке камер Canon она догоняет флагмана EOS-1D Х MARK III. Впрочем и по форме она напоминает его, при этом обладая возможностями беззеркальной системы EOS R. По словам представителей компании. разработчики EOS R3 внесли более 100 улучшений по сравнению с другими зеркальными и беззеркальными моделями Canon. В ней используется новая многослойная матрица с обратной засветкой, обеспечивающая разрешение 24,1 Мпикс. За обработку поступающего сигнала здесь отвечает процессор DIGIC X, который ранее использовался в ряду более ранних профессиональных камер Canon последнего поколения. Отметим электронный затвор обеспечивающий фотосъемку со скоростью до 30 кадров в секунду, а также быструю следящую автофокусировку. Впервые, электронный затвор камеры можно использовать как со вспышками Canon, так и с моделями других производителей в режиме E-TTL со скоростью до 15 кадр/сек. Минимальная выдержка у этой модели 1/64000 сек. Также обращает на себя внимание использование в этой модели достаточно качественного электронного видоискателя с функцией имитации оптического видоискателя и поворотного дисплея. Но самое интересное, это использование в этом аппарате алгоритмов искусственного интеллекта, которые позволяют различать ей людей в масках и шлемах, а также фокусироваться по глазам. При этом на распознавание не влияют такие факторы как поза, макияж или длинная челка. Но это еще не все,-камера сама способна опознавать различные транспортные средства, начиная от велосипедов, различных мотоциклов и заканчивая спорткарами и автомобилями Формулы-1.
170355Искусственный интеллект: Поговорить с роботом
22.11.2021
10:57
Искусственный интеллект: Поговорить с роботом
Так называемый разговорный искусственный интеллект стал еще одним связующим звеном между человеком и компьютером. Эта технология обычно ассоциируется с call-центрами и виртуальными голосовыми помощниками/чат-ботами, хотя ее можно применять практически в любой отрасли. Благодаря достижениям в области машинного обучения и искусственного интеллекта за последние пару лет разговорный искусственный интеллект вышел за рамки чат-ботов и теперь включает в себя множество вариантов использования, позволяющих компаниям использовать его. До последнего времени, существовало мнение, что хотя разговорный ИИ и существует уже несколько лет, но технология пока не готова ни для чего, кроме лаборатории. Однако сейчас, благодаря достижениям в области технологий искусственного интеллекта, ускоренных вычислений и моделей машинного обучения, разговорный искусственный интеллект готов войти в деловой мир в качестве одной из основных технологий, особенно в области обслуживания клиентов. Некоторое время назад на конференции NVIDIA 2021 GTC состоялась встреча экспертов из различных компаний, обсуждавших, как разговорный ИИ повлиял на их бизнес, и поделившихся трендами, формирующими будущее этой новой технологии. Также на конференции сама компания NVIDIA представила Riva Custom Voice, новый набор инструментов, который можно использовать для генерации голосов с использованием данных записи речи всего за 30 минут. Однако, инновации, которые мы сейчас можем наблюдать в области синтеза голоса и речевых данных, изменят способ взаимодействия с виртуальными помощниками и чат-ботами. Существует множество возможностей применения имеющихся данных для создания новых моделей диалогового ИИ, которые учитывают акценты людей и различное звуковое окружение, такое как в шумных кафе и спортивных мероприятиях на открытом воздухе. Искусственный интеллект сможет самообучаться По словам экспертов, в будущем мы увидим, как ИИ перерабатывает свои собственные данные. Подобно фильтру размывающему задний фон в видеотрансляциях, искусственный интеллект может работать как фоновый фильтр в реальном времени, устраняя акцент, когда говорит не носитель языка. В то же время человек на другом конце провода услышит знакомый ему акцент. Эта концепция двунаправленного разговорного ИИ - лишь один из примеров инноваций в этой сфере. Отметим также, что недавно была разработана и запущена новая функция автоматического резюмирования, которая генерирует сводки собраний из речи в текст, чтобы участники могли лучше взаимодействовать между собой и повысить продуктивность. Почему это должно быть в каждом контакт-центре Внедрение и использование ИИ и машинного обучения идет полным ходом. Компания T-Mobile использует искусственный интеллект в своих контакт-центрах для документирования разговоров между клиентами и агентами по обслуживанию клиентов как через чат-ботов, так и через самообслуживание. Оператор беспроводной связи также использует ИИ для преобразования разговоров из речи в текст, чтобы помочь агентам, работающим в центрах обработки вызовов (агентская помощь). Когда разразилась эпидемия COVID-19, колл-центры T-Mobile были завалены запросами клиентов на рассрочку платежей из-за финансовых трудностей, вызванных пандемией. T-Mobile смогла автоматизировать эту простую задачу, развернув чат-бота, который помогал клиентам оформлять платежи. Чего в T-Mobile никак не ожидали, так это получения такой высокой рентабельности инвестиций, запустив чат-бота как небольшой второстепенный проект, который превратился в востребованный инструмент. По словам Хизер Нолис, главного инженера по машинному обучению T-Mobile, были мысли о том, что чат-бот протянет только несколько месяцев. Но в первые 18 месяцев его жизни рентабельность инвестиций этого чат-бота составила 750%.. «В наших call-центрах выполняется множество рутинных задач, в которых люди не нужны. Фактически, мы обнаружили, что около 30% наших клиентов не хотят разговаривать с человеком и предпочли бы голосового помощника». Разговорный ИИ быстро развивается За последние три года разговорный ИИ эволюционировал и включил в себя новые типы моделей, которые обеспечивают более точные прогнозы для обобщения и классификации текста, понимания настроений и выполнения новых задач как в речи, так и в зрении. В дальнейшем разговорный ИИ будет опираться на открытое сотрудничество в концепции open source. Прагматичный ИИ требует максимального использования технологий с открытым исходным кодом. Это одна из определяющих характеристик машинного обучения; оно ориентировано на науку. Это живая система, которую создают люди. Так, к примеру, библиотека Transformers от компании Hugging Face поощряет вклад многих людей из разных отраслей. Доступно более 1600 общедоступных наборов данных примерно на 200 языках. Любой желающий может получить доступ к 70 000 бесплатных моделей, предоставленных сообществом из 1000 участников (и их число постоянно растет). Наборы данных включают в себя все: от классификации текста до расшифровки звука и распознавания объектов на фотографиях и видео. Источник: ZDNet