如何从“可用”到“好用”?江苏“拥抱”DeepSeek之后……
2025-03-31 09:47  来源:交汇点新闻  作者:周永金,徐春晖  
1

2025年开年,DeepSeek横空出世,凭借其低成本、高性能的优势一夜之间在各行各业掀起AI巨浪。

南京上线“满血版”DeepSeek政务类大模型,DeepSeek接入无锡“城市大脑”,徐工汉云实现DeepSeek本地化部署......江苏多地政务系统、多领域企业竞相接入DeepSeek。“接入”之后使用情况如何?大模型在落地端如何从“通用”走向“专用”,从“可用”发展为“可信”?记者走访多方进行调研。

AI顾问“空降”,大模型应用生态初显

“南京某自营性自建房系上世纪80年代建造,危房鉴定为C级,作为宾馆使用,有30间客房,使用液化气钢瓶,应评估为什么风险等级?”

最近,南京市应急管理局工作人员在外调查时遇到了问题,他随即打开“我的南京”政务版APP,点开“宁安晴”输入问题后,AI“顾问”即刻“空降”,现场提供专业意见。

“宁安晴”正是依托南京市数据局政务云“DeepSeek-R1-671B”大模型引擎,打造的全国首个垂直领域应急管理政务大模型。“春节后,我们就马不停蹄推进这项工作。”南京市应急管理局科信处副处长张云龙介绍,“从一线工作人员的实际需求出发,我们选择若干个使用场景如防灾减灾、应急救援、执法检查等,有针对性地开展了模型训练和优化,降低了专业使用门槛,让响应更及时。”

DeepSeek接入政务服务系统之后,对工作人员来说仿佛来了一位“新同事”,在公文处理、方案生成、政策查询等方面能力突出。而面向公众,应运而生的“AI岗位”则通过智能问答、政策解读等功能极大提升服务效率。

走进无锡市政务服务大厅,数字人“小运”随时准备为市民服务。“我该如何申请人才补贴?”听到问题后,数字人“小运”同步调取个人数据,快速生成定制化流程清单。锡企服务平台3.0接入DeepSeek大模型后,企业只需在平台上直接输入要问的问题,AI就能“秒懂”需求,输出答案。

不止在政务服务方向“发力”,DeepSeek更直抵行业一线,在制造、金融、消费、教育、能源等领域得到广泛应用。

智能客服、内容创作、论文翻译、代码解析……今年春季学期,南京航空航天大学的师生们有了专属“小秘书”——DeepSeek“智小航”,无论是学习还是日常琐事,都能为师生“排忧解难”。

“前几年ChatGPT兴起的时候,我们就谋划开发一个校园自有的聊天类大模型系统,但考虑到成本太高暂时搁置。”南京航空航天大学信息化处总工程师何安元分享。DeepSeek的低算力成本让想法成为现实,开学第一天上线的“云端专属满血版DeepSeek”受到师生热捧。“从后台数据来看,每天的活跃人数在5000人上下,师生们会广泛使用该系统进行代码翻译和知识问答,也会关注不少生活问题。”

在工业领域,通用大模型的接入能通过推动生产环节的自动化和智能化,显著提升生产效率和质量,实现生产全生命周期的优化。“DeepSeek和我们自主研发的‘苏畅瑶光大模型’实现了全场景纳管适配,全面增强了工业知识库推理能力,能为设备运行、故障预警诊断和智能化生产提供全面的智能化辅助。”朗坤智慧科技股份有限公司副总经理许勉表示。

解决行业“痛点”,“可用”转向“好用”

在DeepSeek大模型发布之前,多个领域已经做足了“前期功课”,落地了各自的专属大模型。那么,DeepSeek接入后,“好用”在哪?

“主要是解决了行业痛点。”这是多位受访者共同的声音。

在城市管理方面,海量数据如何用活、用好一直是难点。以应急领域为例,张云龙表示,2019年信息化建设以来,应急预案、事故案例、装备资源等业务数据散落在各个系统里,纯靠人力很难整合。一旦发生突发事件之后,如何快速整合资源,调动装备,都是问题。“宁安晴”基于业务数据和系统数据生成应急领域生成垂直数据库,能调用零散数据,形成一份可以辅助决策的文件。

DeepSeek的开源生态也让各行各业打造专属的数据库成为可能。在深度思考的加持下,过去搜索后罗列的一条条“冰冷的”“套路化的”政策法规成为一份份可参考、可操作的行动指南。

近日,任先生鼻塞头疼,来到江南大学附属医院门诊大厅,扫描AI智能导诊二维码后输入症状,系统“丝滑”完成了咨询、分诊,并实现一键跳转挂号。“我能看到系统的‘思考过程’,就像有个医生一样,也让我对导诊判断更放心。”任先生说。

该医院大数据中心处长刘丽表示,这正是此次升级的亮点。“我们引入了思维链技术,模拟医生问诊逻辑,详细解析病情分析逻辑,让患者清楚‘为什么挂这个科’。”

更“聪明”、更“人性化”,也是DeepSeek“满血版”接入的效果之一。

“大模型好比‘大脑’,大脑越好用,给四肢下达的指令就会更精准,也能更好地完成工作。”江苏汇智智能数字科技有限公司(下称“汇智智能”)创始人孙志明说。大模型的能力决定了生成内容的质量,DeepSeek深度思考的能力让生成的内容质量更高。

汇智智能面向行业服务商开发了Agent云平台,上面的智能应用模版可以快速帮助服务商更好地赋能客户。例如本地生活服务商,接入DeepSeek以后的智能获客引流模版,像是一下子达到了“博士”水平,可以生成更优质的内容,更易于传播,扩大影响力。

此外,DeepSeek进一步保障了数据安全。“我们的数据是不联网的,基于政务云搭建的大模型能保证政务数据安全。”张云龙说。何安元同样表示,学校正紧锣密鼓部署本地“满血版DeepSeek”,以消除数据泄露风险,保护好师生们的学术研究成果。

避免模型“幻觉”,筑牢“AI普惠”底座

多个领域“尝鲜”DeepSeek初显成效,应用中的“水土不服”难题也接连涌现。

“模型幻觉”,是受访者们普遍反映的核心问题。

大模型也“要面子”,可能生成“幻觉内容”,存在乱说、乱讲、乱编的情况,尤其在政策解读、法律咨询等场景风险极高。“大模型在思考中不可避免地会发散,还可能产生自我认知,如何解决幻觉,让大模型从‘可用’到‘可信’,将会是未来大家共同努力的方向。”许勉说。

南京理工大学紫金卓越教授戚湧表示,可以通过“喂”入专业语料进行精准训练,发挥数据价值。记者注意到,在“宁安晴”的应用中,就已经专门设立了标错功能,工作人员使用时能看到具体内容的出处,出现问题后可以点击纠错,帮助大模型回答更精准。

许勉也分享,在应用时,他们对通用大模型进行了微调,反复训练以实现全场景适配。“为了提升模型能力,我们一方面尽量给大模型‘喂’入更多行业知识,另一方面引导大模型学习我们专家的思考方式,精准解决问题。”

技术瓶颈,则是横亘在大模型发展之路上的“又一道槛”。

“如何跨过从‘实验室理想’到‘工业级落地’的鸿沟,是大模型发展中亟待解决的问题。”东南大学计算机科学与工程学院教授邸世民说,一方面是场景泛化能力不足,复杂领域环境导致模型失效,并且长尾场景覆盖难,中小企业的非标准化需求难以被通用模型满足;另一方面,国产算力生态尚未成熟,且中小企业难以负担,配置、训练和推理所需的人才及计算资源。

因此,他也建议,要构建省级算力统筹平台来降低中小企业使用门槛。在技术层面,有关部门可以联合高校研发面向江苏制造业的“工业级瘦身模型”,适配国产芯片,同时推动国产算力生态适配,降低迁移成本。“另外,还要持续推动试点示范与推广,通过分领域打造标杆场景、建立可复制推广体系,实现从‘盆景’到‘风景’。”邸世民说。

事实上,破解成本问题,江苏不少企业已在发力。比如,汇智智能正计划推出大模型一体机。“我们会提供‘算力+品牌+服务’的一站式解决方案,一体机里配备好软件、硬件,接入市面上多个大模型以及企业内置知识库,购入后直接到企业开机就可以使用,减少企业的学习成本。”孙志明说。与此同时,朗坤智慧也在筹谋大模型的新交互形式,使得模型能够适用于复杂工业场景,“一条指令”就能解决工业难题。

如何避免“为AI而AI”,也是各界讨论的核心问题。“以工业领域为例,接入后要确实能实现降本增效,要避免只是‘面子工程’。”邸世民表示,有关部门还要注重从“通用”到“专用”,解决行业数据不互通,避免数据可用不可见,从而解决“数据孤岛”问题。

无锡市城运中心、网络基建部副部长杜巍在落地过程中同样发现,模型能力与业务需求存在差距,需定制化开发才能有效落地。“模型效果高度依赖高质量训练数据,但政务数据常存在格式不统一、标注缺失等问题,需要建立标注数据动态更新机制,引入主动学习策略优化标注效率。”

“人要主导人工智能,不能让人工智能替代人的决策。”戚湧说。多位采访者也表示,AI更多充当的是“顾问”角色,快速整合提供解决方案,但最终做出决定的还是人。3月27日,江苏省互联网协会牵头编制《DeepSeek使用指南》发布,为各行各业的群体提供操作性强的使用手册,解决问不准、问不好的问题。

数字新浪潮下,DeepSeek为科幻想象落地现实提供了技术力,从“好用”到“用好”还有着更多的可能性等待挖掘。路漫漫其修远兮,让我们以正确的心态和方式一同深度求索。

新华日报·交汇点记者 周永金 徐春晖

标签:
责编:周永金