MakeSomethingNew 株式会社(总部:东京都,代表取缔役:杉山英一)宣布,已公开一份调查结果,验证在将 LLM 导入 Web 服务与业务系统时,哪些模型较具实用性;同时开始免费提供支持 LLM 实作中重要环节的「提示工程工具」,协助提示词设计、评估与改善。 近年来,以 ChatGPT 为代表的生成式 AI 应用迅速普及。然而,企业在将 LLM 集成进自家 Web 服务或业务系统时,仅选择高性能模型并不足够。实际开发现场还需要综合考量回答准确度、回应速度、成本、稳定性、与既有系统的集成,以及提示词的可维护性等多个面向。 MakeSomethingNew 过去通过企业 AI Agent 建置服务,从 AI 应用构想整理、需求定义、设计、开发、导入到营运支持,提供一贯协助。通过此次调查结果与免费工具的提供,该公司将更具体地支持企业在把 LLM 导入实际服务时的初期评估与实作流程。 背景方面,随着生成式 AI 普及,许多企业开始投入以 LLM 为基础的新服务开发、业务效率化、客服应对、内部知识搜索与文档撰写支持。然而,在实际将 LLM 导入 Web 服务或业务系统时,常会遇到不知道该选择哪个 LLM、难以判断各模型在准确度、速度与成本上的差异、提示词依赖个人经验撰写、无法管理提示词改善历程与评估结果、开发环境可运作但正式服务品质不稳定,以及不清楚如何把 LLM 输出衔接到业务流程或既有系统等问题。 LLM 应用正从「用聊天方式试用」的阶段,转向「集成进业务与服务并持续改善」的阶段。因此,将模型选择与提示工程视为开发流程的一部分变得相当重要。 本次 MakeSomethingNew 假设将 LLM 导入 Web 服务,针对主要 LLM 从多个观点进行比较与验证。调查结果显示,在 LLM 实作中,重要的不是永远使用最高性能模型,而是根据回应时间等条件灵活分工使用不同模型。例如,在需要复杂判断或高精度文章生成的场景,高性能模型具备优势;而在定型分类、摘要、信息抽取与简易客服应对等场景,使用速度与成本表现较佳的模型更为实际。 此外,在导入 Web 服务时,除了单次回答准确度,也需要以持续改善为前提进行设计,包括回应速度、失败时的重试设计、提示词版本管理、日志分析与评估数据累积等。 此次免费提供的提示工程工具,是协助在将 LLM 导入 Web 服务或业务系统时进行提示词创建、比较与改善的工具。主要功能包括提示词创建与保存、多个提示词比较、确认不同模型的输出结果、管理提示词改善历程,以及针对 Web 服务导入情境的一次性批量确认。通过此工具,开发者与业务负责人不必再以个人方式管理提示词,而能由团队共同验证与改善 LLM 实作。 除调查结果与免费工具外,MakeSomethingNew 也将支持企业在 LLM 应用上的多个领域,包括使用 LLM 的 Web 服务开发、既有服务导入 LLM 功能、AI Agent 设计与开发、与内部数据及业务系统集成、RAG 架构设计与实作、提示词设计与评估改善、模型选择与成本优化,以及从 PoC 到正式导入的陪跑支持。 MakeSomethingNew 表示,将协助企业不让生成式 AI 停留在实验阶段,而是能将其导入实际服务与业务流程,成为持续创造价值的机制。未来公司也将进一步强化 LLM Web 服务开发、AI Agent 建置、业务系统集成与提示工程支持,并持续发布依产业与业务别设计的 LLM 应用模板,以及模型选择与提示词评估相关信息,协助企业安全且有效地导入生成式 AI。 公司名称为 MakeSomethingNew 株式会社,代表者为代表取缔役杉山英一,事业内容包括 AI Agent 建置支持、AI 应用支持、LLM 实作支持、系统企划与开发支持。公司网站为 https://makesomethingnew.jp/ ,相关洽询可通过服务页面或公司联系表单提出。