Писатель выпускает Palmyra X5, обеспечивает результаты GPT-4.1 на 75% меньше затрат

Присоединяйтесь к нашим ежедневным и еженедельным информационным бюллетеням для последних обновлений и эксклюзивного контента в лидирующем отраслевом освещении искусственного интеллекта. Узнать больше

Писатель, компания Enterprise Generative AI, стоимостью 1,9 миллиарда долларов, сегодня выпустила Palmyra X5, новую крупную языковую модель (LLM) с обширным контекстом в 1 миллион, которое обещает ускорить принятие автономных агентов ИИ в корпоративных условиях.

Компания из Сан-Франциско, которая считает Accenture, Marriott, Uber и Vanguard среди своих сотен корпоративных клиентов, позиционировала модель как экономичную альтернативу предложениям от промышленных гигантов, таких как OpenAI и антроповые, ценообразование на сумму 0,60 долл. США за миллион токенс и 6 миллионов долларов.

«Эта модель действительно раскрывает агент мира»,-сказал Матан-Поль Шетрит, директор по продукту писателя, в интервью VentureBeat. «Это быстрее и дешевле, чем эквивалентные модели с большими контекстными окнами, такие как GPT-4.1, и когда вы объединяете его с большим окном контекста и способностью модели выполнять инструмент или вызов функций, это позволяет вам начинать действительно делать такие вещи, как многоэтапные агентные потоки».

Сравнение эффективности модели искусственного интеллекта, показывающее, что писательский Palmra X5 достигает почти 20% точности на эталоне MRCR Openai примерно в 0,60 долл. США за миллион токенов, позиционируя ее против более дорогих моделей, таких как GPT-4.1 и GPT-4O (справа), которые стоят более 2,00 долл. США за токены. (Кредит: Писатель)

Прорыв AI Economics: как писатель обучил модель мощности всего за 1 миллион долларов США.

В отличие от многих конкурентов, писатель обучил Palmyra X5 с синтетическими данными примерно за 1 миллион долларов затрат на графический процессор — часть того, что требуют другие ведущие модели. Эта экономическая эффективность представляет собой значительный отход от преобладающего промышленного подхода тратить десятки или сотни миллионов на разработку модели.

«Мы считаем, что токены в целом становятся дешевле и дешевле, и вычислитель становится все дешевле и дешевле», — объяснил Шетрит. «Мы здесь, чтобы решить реальные проблемы, а не никель и смягчать наших клиентов по ценам».

Преимущество стоимости компании связано с проприетарными методами, разработанными в течение нескольких лет. В 2023 году писатель опубликовал исследование «Стало самостоятельной конструкции», которое ввело критерии ранней остановки для настройки минимальных инструктов. Согласно Shetrit, это позволяет писателю «значительно сократить расходы» в течение учебного процесса.

«В отличие от других фундаментальных магазинов, мы считаем, что мы должны быть эффективными. Мы должны быть эффективными здесь», — сказал Шетрит. «Мы должны предоставить нашим клиентам самые быстрые и дешевые модели, потому что в этих случаях действительно имеет значение».

Million-Token Marvel: техническая архитектура, обеспечивающая скорость и точность Palmyra X5

Palmyra x5 может обработать полную подсказку на миллион затрат примерно за 22 секунды и выполнить вызовы функций с несколькими разворотами примерно за 300 миллисекунд-показатели производительности, которые, как утверждает писатель, позволяет «агентское поведение, которое ранее было расходованным или по времени».

Архитектура модели включает в себя две ключевые технические инновации: гибридный механизм внимания и подход экспертов. «Гибридный механизм внимания… вводит механизм внимания, который внутри модели позволяет сосредоточиться на соответствующих частях входов при генерации каждого выхода», — сказал Шетрит. Этот подход ускоряет генерацию ответа, сохраняя точность в обширном контекстном окне.

Архитектура гибридного внимания Palmyra x5 процесса архитектуры внимания обрабатывает массивные входы через специализированные блоки декодера, что обеспечивает эффективную обработку контекстов с миллионом ток. (Кредит: Писатель)

На эталонных тестах Palmyra X5 достигла заметных результатов по сравнению с его стоимостью. На тесте Openai MRCR 8-needle, который бросает вызов моделям, чтобы найти восемь идентичных запросов, скрытых в массовом разговоре, Palmyra X5 набрала 19,1% по сравнению с 20,25% для GPT-4,1 и 17,63% для GPT-4O. Он также помещает восьмое в кодировании на тесте BigCodebench со счетом 48,7.

Эти тесты демонстрируют, что, хотя Palmyra X5 может не привести к каждой категории производительности, он обеспечивает возможности для почти флегширования при значительно более низких затратах-компромисс, который, по мнению писателя, будет резонировать с предприятиями, ориентированными на рентабельность инвестиций.

От чат -ботов до автоматизации бизнеса: как агенты искусственного интеллекта преобразуют корпоративные рабочие процессы

Выпуск Palmyra X5 произошел вскоре после того, как писатель обнародовал HQ AI в начале этого месяца — централизованную платформу для предприятий для строительства, развертывания и контроля агентов ИИ. Эта двойная стратегия продукта позиционирует автора, чтобы извлечь выгоду из растущего спроса на предприятие на ИИ, который может автономно выполнять сложные бизнес -процессы.

«В эпоху агентов модели, предлагающие менее 1 миллиона жетонов контекста, быстро станут неактуальными для критически важных вариантов использования»,-говорится в заявлении писателя и соучредителя Waseem Alshikh.

Шетрит уточнил этот момент: «В течение долгого времени был большой разрыв между обещанием агентов искусственного интеллекта и тем, что они на самом деле могли бы доставить. Но у писателя мы сейчас видим реализацию агентов в реальном мире с крупными предпринимательскими клиентами. И когда я говорю реальные клиенты, это не похоже на случай использования туристического агента. Я говорю о компаниях Global 2000, решающем самые гнарлистые проблемы в своем бизнесе».

Ранние пользователи развертывают Palmyra X5 для различных рабочих процессов предприятия, включая финансовую отчетность, ответы RFP, документацию поддержки и анализ отзывов клиентов.

Один особенно убедительный вариант использования включает в себя многоэтапные агентские рабочие процессы, когда агент ИИ может пометить устаревший контент, генерировать предлагаемые изменения, делиться ими для одобрения человека и автоматически нажимать одобренные обновления в систему управления контентом.

Этот переход от простой генерации текста к автоматизации обработки представляет собой фундаментальную эволюцию в том, как предприятия развертывают ИИ — переход от увеличения человеческой работы к автоматизации целых бизнес -функций.

Писатель Palmyra X5 предлагает увеличение размера окна в контексте на 8 раз по сравнению с предшественником, что позволяет ему обработать эквивалент 1500 страниц одновременно. (Кредит: Писатель)

Стратегия расширения облака: AWS Partnership приводит AI писателя в миллионы разработчиков предприятий

Наряду с релизом моделей, писатель объявил, что и Palmyra X5, и ее предшественник Palmyra X4 теперь доступны в Amazon Bedrock, полностью управляемой услуге Amazon Web Services для доступа к моделям фундамента. AWS становится первым облачным поставщиком, который доставит полностью управляемые модели от писателя, значительно расширяя потенциальный охват компании.

«Беспланный доступ к писательской Palmra X5 позволит разработчикам и предприятиям строить и масштабировать агентов ИИ и преобразовать то, как они разбираются в огромных количествах предприятий, внедряя безопасность, масштабируемость и производительность AWS», — сказал Атул Део, директор Amazon Bedrock в AWS, в объявлении.

Интеграция AWS рассматривает критический барьер для принятия ИИ предприятия: техническая сложность развертывания и управления моделями в масштабе. Сделав Palmyra X5 доступным через упрощенный API Bedrock, писатель может потенциально достичь миллионов разработчиков, которым не хватает специализированного опыта для непосредственной работы с моделями фундамента.

Самообучение ИИ: видение писателя для моделей, которые улучшаются без вмешательства человека

Писатель поставил смелое заявление о контекстных окнах, объявив, что 1 миллион токенов будет минимальным размером для всех будущих моделей, которые он выпускает. Это обязательство отражает мнение компании о том, что большой контекст необходим для агентов искусственного интеллекта предприятия, которые взаимодействуют с несколькими системами и источниками данных.

Заглядывая в будущее, Шетрит идентифицировал самооткрытие моделей как следующее крупное продвижение в области искусственного интеллекта предприятия. «Реальность сегодня, агенты не выступают на том уровне, который мы хотим, и нуждаемся в них для выполнения», — сказал он. «Что я считаю реалистичным, так это то, что пользователи приезжают в штаб-квартиру ИИ, они начинают делать это картирование процесса… и тогда вы наносите на это или в этом или внутри него, модели самооткрытия, которые учатся на том, как вы делаете вещи в своей компании».

Эти возможности самоотверждения в корне изменят, как системы ИИ улучшаются с течением времени. Вместо того, чтобы требовать периодической переподготовки или точной настройки специалистами по искусственному искусству, модели будут постоянно учиться на своих взаимодействиях, постепенно улучшая их производительность для конкретных вариантов использования предприятия.

«Эта идея о том, что один агент может управлять ими, не реалистична», — отметил Шетрит, обсуждая различные потребности разных бизнес -групп. «Даже две разные команды продукта, у них так много таких разных способов выполнения работы, самих ПМС».

Новая математика Enterprise AI: как стратегия писателя 1,9 млрд. Долл. США бросает вызов Openai и Anpropic

Подход писателя резко контрастирует с подходом Openai и Anpropic, которые привели к финансированию миллиардов, но больше сосредоточены на развитии ИИ общего назначения. Вместо этого писатель сконцентрировался на создании моделей, специфичных для предприятий, с профилями затрат, которые обеспечивают широкое распространение.

Эта стратегия привлекла значительный интерес инвесторов, причем компания получила 200 миллионов долларов в финансировании серий C в ноябре прошлого года, а также 1,9 миллиарда долларов. Раунд был сопоставлен Premji Invest, Radical Ventures и рост Iconiq, с участием стратегических инвесторов, включая Salesforce Ventures, Adobe Ventures и IBM Ventures.

По данным Forbes, у писателя есть замечательный чистый уровень удержания на 160%, что указывает на то, что клиенты обычно расширяют свои контракты на 60% после первоначального усыновления. По сообщениям, компания имеет более 50 миллионов долларов в виде подписанных контрактов и проектов, которые в этом году удвоятся до 100 миллионов долларов.

Для предприятий, оценивающих генеративные инвестиции в области искусственного интеллекта, писатель Palmyra X5 представляет убедительное ценностное предложение: мощные возможности за долю от стоимости конкурирующих решений. По мере развития экосистемы агента AI, ставка компании на экономические модели, ориентированные на предприятие, могут вы выгодно позиционировать ее против более финансируемых конкурентов, которые не могут быть настолько настроены на требования к ROI бизнеса.

«Наша цель состоит в том, чтобы как можно быстрее привести к широкому распространению агента по всей нашей клиентской базе», — подчеркнул Шетрит. «Экономика проста-если мы оцениваем наше решение слишком высокое, предприятия просто сравнит стоимость агента искусственного интеллекта с человеческим работником и не смогут увидеть достаточную ценность. Чтобы ускорить принятие, нам необходимо обеспечить как превосходную скорость».

В отрасли, часто очарованной техническими возможностями и теоретическими потолками эффективности, прагматичный акцент писателя на эффективности затрат может в конечном итоге оказаться более революционным, чем еще одна десятичная точка улучшения. По мере того, как предприятия становятся все более изощренными в измерении бизнеса ИИ на бизнес, вопрос может переместиться от «насколько мощная ваша модель?» «Насколько доступен ваш интеллект?» — и писатель делает ставку на свое будущее, что экономика, а не только возможности, определит победителей ИИ.

Источник