打造垂直领域大模型，追一科技助力金融政务智能化

2023-04-21 14:40:21

北京

　　AI大时代，短短几个月，大模型就狂风席卷。

　　据不完全统计，目前国内号称投入大模型的厂商有30多家之多，市场拥堵。不同行业、不同体量、各种规模、不同层次的大模型争流而上，各种版本让人眼花缭乱。对于企业级市场而言，大模型距离落地是“一步之遥”，或者是“万水千山?” 面对细分复杂的场景，如何在经济、可信、高效的基准上，与客户一起共创大模型，让数字化转型再上新台阶?

　　基于多年的NLP技术积累与行业实践，面向客户洞察和需求，追一科技全面拥抱大模型技术，自主研发领域大模型“博文Bowen”，现有AI数字员工产品矩阵也将陆续整合大模型技术和能力，进化升级，提升效能，更好助力金融、政务等领域客户数字化、智能化升级。同时，追一科技也将与头部客户和合作伙伴一起，共创合作、打磨场景应用，加快推进大模型成熟落地。

　　AI大模型落地的三大挑战

　　1、安全

　　不管什么样的技术创新应用，安全都是一道红线。从宏观层面“安全发展”到企业自身数据安全、用户隐私保护、合规信创的角度，都需要考量安全挑战。ChatGPT火爆全球，出于数据跨境监管要求和国家层面数据主权安全风险考虑，政务、金融等行业不适合在业务中直接接入ChatGPT模型。从技术自主与信息安全的双重角度来看，国产大模型独立自主发展均具有必要性。

　　2、性价比

　　大模型的落地和商业应用，需要考虑成本的经济性。庞大的数据、算力和研发投入成本，而场景、收益的相对不确定性，让大模型至少在短期阶段，还面临落地挑战。“大力出奇迹”、“暴力美学”在推高效果同时，效率也是必须关注的问题。特别是企业级市场，如何以更低成本和更高效方式，研发可精准解决垂直领域任务模型，将是一个新课题。

　　3、专业、可控

　　通过对话交互形式，ChatGPT大模型表现了极强的出圈、跨界、多任务能力。“一本正经地胡说八道”，放在一些消费级和通用场景无伤大雅，但在专业和垂直领域，如何确保“不翻车”?保证内容的确定性、专业化，真正解决用户问题?从信息“高速公路”到终端家门口，还需要弯弯绕绕一段路。

　　深入领域应用实践，追一科技大模型博文Bowen助力行业智能化

　　在多年的企业数字化服务实践基础上，追一科技紧贴安全、合规、信创等新时代智能化要求，推进创新AI技术能力应用，并不断探索智能化应用的新范式，构建以垂直领域大模型“博文Bowen”为核心的大模型平台能力，赋能人机对话交互和协同、分析等场景应用。在行业大模型解决方案上，锚定金融、政务领域，整合大模型能力引入到当前成熟的技术栈，提升产品效能，使客户实现“降本增效”，并赋能更多智能化应用场景。

　　相比通用大模型，追一自研领域大模型将拥有更垂直适用的任务能力，可适配具体行业业务场景中的任务，如金融、政务领域中的咨询服务、文案生成、专家决策等;在知识能力上，更有领域内纵深优势，且保证即时性。在应用方式上，支持私有化部署，对于金融、运营商等垂直行业的特定场景，保证数据安全的同时，还能更灵活地去应对业务场景。

　　咨询服务

　　为客户提供高质量的精准服务，优化流程性任务的体验，可根据客户交互信息、历史数据做出快速而准确的建议。例如，在金融行业的理财咨询中，根据历史数据与客户风险偏好，为客户提供金融产品或定制化个人理财建议。政务场景中，各地相关政策具有多样性，基于大模型能力，可根据与居民/企业的交流内容，快速判定并精准适配最新政策，实现高效便民服务。

　　辅助生成

　　可根据公开市场信息及实时数据，辅助相关文案的生成。在金融领域中，可根据公开市场信息及实时数据生成时效性报告(如财经新闻、金融市场报告)与分析类报告(投研分析报告)等。在政务领域中，生成如指挥类、通联类、公布类、记录类、报请类等规范性公文以及如工作报告、简报、书信、启事类等非规范性事务公文。

　　专家系统

　　根据相关政策法规，以及与用户对话信息做出专业、准确的判断与决策。例如，在保险理赔中，通过与客户的对话快速识别问题，了解损失详细情况，更快处理理赔请求。在信贷投保审批过程中，协助银行分析借款人的信用状况和还款能力，协助保险公司分析投保人资格和匹配险种。在舆情监控方面，对相关舆情数据自动化处理和分析，为政策制定提供科学依据;在警务处理上，可对报警信息进行快速识别、判断，提高决策与出警效率。

　　而随着大模型的落地，除了现有AI机器人场景的升级提效外，未来将有更多场景解锁。

　　深耕NLP，技术攻关极致创新

　　大模型的创新，离不开坚实的AI技术底座。

　　追一科技作为深耕NLP多年的佼佼者，在发展中一直紧密追踪学术前沿，保持预判并率先布局前沿技术。在自然语言预训练模型方面，先后研发了Simbert、T5-Pegasus中文模型、RoFormerV2等创新模型。自研Roformer模型中的旋转位置编码RoPE技术被Google、Meta、腾讯等大厂大模型采用，成为大模型的标配位置编码方式之一。

　　团队还致力于通过工程化能力，实现资源、效率、效果平衡与最优解，挖掘模型参数与训练数据量平衡点同时保证模型涌现能力，为大语言模型研发提供保障。自研bert4keras框架，适配数十个中文开源模型，在中文NLP圈应用。自研Tiger优化器，在训练阶段将显存优化到极致，降低训练成本。

　　在领域大模型的构建中，追一科技研发团队采用生成式预训练+强化学习算法，将所有任务统一转换为文本生成任务，通过采用「领域数据」预训练+Prompt 数据微调和基于RLEF「领域专家反馈」强化学习(Reinforcement Learning from Expert Feedback)，搭建垂直领域大模型。

　　同时，以垂直领域大模型作为核心，以其它专有模型辅助，共同支持需求，并通过知识外引与注入，如搜索、推荐、查询等知识工具，结合知识整合模块，整合各类垂类知识，形成一套安全可控且高度适配下游业务逻辑的完整AI系统，为客户提供高效、高质的解决方案。

猜你喜欢：

四部门联合开展“精康融合行动” 增强精神障碍患

全国艺考培训机构专项治理行动取得进展依法取缔

中国残联召开残疾人社保座谈会积极有序探索多层

将文博单位纳入消防监管重点对象

嘉士伯天目湖拉罐车间获“江苏省智能示范车间”认

天宝营养IPO：报告期净利润波动大短期偿债压力大“

科峰传动吴俊峰当选全国工商联第十三届执委

雅培捐赠价值超1680万元医学营养品为一线医务工

2025年开奶茶店，为什么建议你小成本投资？

孩子总感冒？试试瑞士PhytoKids的“植物免疫盾”

酒糟变肥料、AI助力农场防灾减灾、废品变时尚产品

实力比拼才见真章，瑞虎7 PLUS对比卡罗拉锐放全面解

孕产妇专用营养总是补了不吸收？试试美好蕴育润康

达索系统携手FondaMental基金会，在法国推出面向精

HPE推出零信任网络与私有云运维解决方案，重新定义

Covation Biomaterials瑞讯生物材料在中国国际