Результаты поиска для "MPT"
07:39
Согласно отчету Kechuangban Daily от 2 августа, крупномасштабная модельная платформа Baidu Smart Cloud Qianfan завершила новый раунд обновлений, получив полный доступ к 33 крупномасштабным моделям, включая полную серию LLaMA2, ChatGLM2, RWKV, MPT, Dolly. , OpenLLaMA и Falcon стали платформой с наибольшим количеством крупных моделей в Китае, а подключенные модели подверглись вторичному повышению производительности по сравнению с платформой Qianfan, а стоимость обоснования модели может быть снижена на 50%. В то же время платформа Qianfan запустила библиотеку preset_template со 103 шаблонами, охватывающими более десяти сценариев диалогов, игр, программирования и письма. Кроме того, это обновление снова выпустило ряд новых плагинов.
06:55
Согласно отчету IT House от 25 июня, ИИ-стартап MosaicML недавно выпустил свою языковую модель MPT-30B, которая имеет 30 миллиардов параметров, а стоимость обучения составляет «лишь часть других аналогичных конкурирующих моделей». расширяет применение моделей ИИ в более широком диапазоне областей. Навин Рао, генеральный директор и соучредитель MosaicML, сказал, что стоимость обучения MPT-30B составляет 700 000 долларов США (около 5,0244 млн юаней), что намного ниже десятков миллионов долларов, необходимых для аналогичных продуктов, таких как GPT- 3. . Кроме того, из-за более низкой стоимости и меньшего размера MPT-30B также может быстрее обучаться и больше подходит для развертывания на локальном оборудовании. Сообщается, что MosaicML использует технологии Alibi и FlashAttention для оптимизации модели, что позволяет увеличить длину текста и более эффективно использовать вычисления на GPU. MosaicML также является одной из немногих лабораторий, которые могут использовать графический процессор Nvidia H100.По сравнению с предыдущими достижениями текущая пропускная способность каждого графического процессора увеличилась более чем в 2,4 раза, что может сократить время завершения.
  • 2
Загрузить больше
Актуальные теги

Популярные темы

Больше

Крипто-календарь

Больше
Блокчейн Жизнь 2025 в Дубае
Aethir запланирован для участия в конференции Blockchain Life 2025, которая пройдет в Дубае с 28 по 29 октября. Ожидается, что на мероприятии соберутся держатели из сектора криптовалют для обсуждения текущих рыночных тенденций и технологических достижений.
2025-10-28
Будущее денег, управления и права 2025 в Вашингтоне
Констелляция собирается участвовать в конференции «Будущее денег, управления и права 2025», которая запланирована на 30 октября в Вашингтоне.
2025-10-29
Завершение работы устаревшей Основной сети
Neo официально напоминает, что основная сеть Neo Legacy будет отключена 31 октября. Пользователей призывают завершить миграцию активов до крайнего срока, чтобы избежать риска потери средств. Сеть Legacy, изначально запущенная как основная сеть AntShares в 2016 году, будет полностью деактивирована, что ознаменует конец её операционной фазы в экосистеме Neo.
2025-10-30
Неделя ИИ в Сиэтле
Компания Arcblock планирует представить новое партнерство во время недели искусственного интеллекта в Сиэтле с 27 по 31 октября. Ожидается, что конференция привлечет более 3,500 участников и в списке спонсоров указаны Coinbase, Accenture и другие компании.
2025-10-30
Хакатон
Flow запускает Forte Hacks, виртуальный хакатон с призами и бонусами на сумму более 250 000 долларов, который пройдет с 1 по 31 октября. Цель мероприятия — исследовать полный потенциал экосистемы Flow. Forte теперь доступен в тестовой сети Flow, что позволяет разработчикам начать работу над своими проектами до начала хакатона.
2025-10-30