数旗智酷专访 | 众数信科吴炳坤:政务大模型不需要“全知全能”

2023-12-12 09:46
图片

访谈嘉宾:吴炳坤   众数信科CEO

访 谈   人:唐   鹏   数旗智酷创始人、首席研究员


Q:过去三十年,互联网对政府运作形态的影响主要在于“透明政府”、“整体政府”、“服务型政府”的建设,您认为大模型(是否)将进一步对数字政府的未来发展产生哪些根本性的变化?


A:最近半年来接触了很多政府机构,大模型也是他们特别关注的话题。在我看来,大模型对数字政府未来发展的影响主要存在于交互方式与内容生成两个方面,影响的深度肯定会大于互联网和移动互联网。


互联网时代的交互方式主要是通过鼠标和键盘,移动互联网时代主要通过触摸/手势和语音,技术的进步使服务形态发生了根本性变化。以 ChatGPT 为代表的AI大语言模型应用将复杂交互做了根本性的颠覆,因为只有人与人的对话是最顺畅的,类 ChatGPT 应用以拟人化的预训练大语言模型提供了接近于人类交流的舒适度与流畅度。因此,大模型应用于政府领域,使市民与数字政府之间的交互会更流畅和便捷,可以视为数字政府的专家级陪伴或助手。


其次是内容生产。政务服务强调服务的透明度和一致性。“互联网+政务服务”发展过程中提出的“数据多跑路、群众少跑腿”或“最多跑一次”,“跑”本身就是一个依靠人来生产内容的过程。而移动互联网时代诞生的更为便捷的“指尖办事”,也还是依靠人来生产,只是生产的内容更加多元化,比如照片、声音、指纹等等。未来政府将可以依靠大模型来生成高质量的内容,成本更低,实时生成,信息量更大。比如之前新闻报道 GPT-4 在教育、医疗等领域取得了显著成绩,比如通过托福考试、考取医疗资格证等。那么对于政务服务这样一个专业而严肃的领域也应该是值得期待的。


大模型会让数字政府带给人们越来越符合预期的服务品质。


图片


Q:目前很多政务服务平台都将智能咨询、智能搜索、智能问答机器人等作为标配进行建设,大模型与之相比最根本的区别与优势是什么?


A:它们之间采取的是完全不一样的技术路径。目前我们看到的政府网站智能咨询、智能问答机器人等,它们实现的技术逻辑是基于规则、模板和 AI 小模型进行构建的,利用的是结构化数据,对用户问题的理解和回复能力是有限的,对于用户的专业性要求也很高。如果问的问题没有命中后台的知识库,机器是回答不了的,更多的是一种检索式的问答。这些应用背后的整个内容是需要人工不断更新维护的。


大模型最大优势是具有强大的语言理解与生成能力。如果用户对政务服务的专业术语把握不准确、理解不到位,可以通过多轮对话来引导用户理解意图,以给出更为人性化的贴切回答。


大模型的知识面更广泛,涵盖的信息范围非常大,并且具备逻辑推理能力。原来的搜索或智能问答基本都是基于规则化的信息输出,给出多个可能的内容让用户选择。大语言模型是基于神经网络,通过多步推理对问题进行深度分析,最终给出总结后的最终结论性回复。


此外,大模型相比之前的智能互动应用具有更优秀的“创造力”,它不仅可以自动检索知识点,更重要的是具备“思维链”——可以对问题进行创造性回答,为用户提供更人性化、更贴切的服务。


另外,需要关注大模型的安全性和伦理规则,不要失控。在数字政府这个领域建议私有化部署,进行场景化的微调定制,应用一定需要边界感。


由于类 ChatGPT 大模型应用都具有极强的互动性,会对用户的交互内容进行学习,所以在数字政府领域的应用和部署,需要进行“切块式”的创新。我们目前还不是直接将大模型进行交付,而是建立一个工程化中台,或者类似一个“伦理安全缓冲带”,很多数据都是在我们本地的向量数据库进行沉淀,对外部语料导入到中间层进行理解或“问答审计”,建立一道安全防火墙。


图片


Q:从“搜索即服务”到“对话即服务”,大模型对未来的政务公开、政务服务的模式与体验将产生怎样的影响?


A:对老百姓而言,第一个最直接的影响是政府透明度和公众获得感。原来我们都是通过登录到政府网站或政务App的被动搜索,大模型会结合用户个体不同的特征来推送个性化的政务信息。比如政务App一般都有几百上千项服务,内容庞杂,搜索也很难解决。所以通过大模型结合语音或其他输入模式,可以推动用户直接进入办事流程,而不是提供导航路径或指南信息,这将极大地缩短用户旅程。


第二个影响是服务便捷性和高效性。比如原来办一件事都会是先找到应用入口,然后开始填写表格,然后填写过程中可能还需要反复确认或来回重复。未来可能就是直接输入一个指令,大模型可以帮助我们直接将目标事项的功能点调出来,然后通过人与机器对话的方式输出办事需要的信息,大模型进行自动回填,可以真正实现“边聊边办”的效果。


大模型的插件生态越来越丰富,可以为大模型的行业应用场景提供眼、手、脚等,未来在一网通办和一网统管的工作协同中可以支撑打通部门数据壁垒,通过对话体系把办事需要的数据串联起来。


最近我们参与了两个政务大模型的场景建设,一是“随手拍”。“随手拍”是一个城市数字服务过程中已经比较“古典”的应用,大模型能力的加入创新了城市治理能力。比如原来市民如果在一个街区看到减速带破裂,需要拍照后再输入一段话进行描述,然后上报12345进行工单流转。现在通过视觉大模型的理解,以及与 GIS 地图结合应用,在拍照完成后,系统会自动填写事件描述,事件上报12345派单后,原来经常会派错部门,或者流转几天后才派单。现在在事件处置环节,大模型自动匹配到对应部门,并告诉他们应该如何处理,此外还可以通过提问互动来进行指导。


另一个案例是低保人群的补贴申领。低保人群很多人无法在线交流,有些问题机器也回答不了,所以只能靠打电话。比如有的低保户打电话就问“民政有针对我们‘这类人’的补贴政策吗”,按照以往的智能问答逻辑,这个问题就无法回答。现在大模型就可以继续问“能不能简单描述家庭收入基本情况”,对方回答“全年收入30000元”,大模型此时就可以判别他“符合低收入情况”,然后如果继续问“那要怎么办理”,大模型就继续询问他的住址,这样就可以告诉他最近的办理地点。所以从以上用户输入的核心信息里,地址、收入、年龄等都没有包含在内,这就需要大模型通过多轮对话去捕捉真实需求。因此大模型对原来的政务服务办理模式实现了解耦,这种解耦是通过拟人化的交流进行的。


Q:政府拥有大量的数据资源,哪些类型的数据更适合大模型,公文类应用大模型是否合理?


A:我不认为大模型能写出高质量的公文范本,对于公文而言,应该是辅助而不是替代,且这种辅助是建立在对已有数据的学习基础之上。比如不同的地方、不同时期的政府班子都会有自己的施政纲领,这种面向未来的创造性思想与设计是大模型爱莫能助的。


对于辅助性价值而言,大模型除了学习公文的写作框架,其更大的优势在于知识网络层面的支撑。比如某市政府研究室的写作人员在写作公文的时候需要引用某个文件,但他只记得几个关键词,原文是如何描述的已经忘记,那么当他输入某个词的时候就可以出现关联文件或段落,这就可以提升写作效率。另外就是对于一些政府的调研报告、规划文件等都需要提交简略版的请示报告,这就非常符合大模型的应用场景,可以很快地对全文进行总结提炼。当然,在应用公文大模型的时候,需要注意的是语料的问题,需要内部构建一个专用知识库,开放给专门人员使用,对于专业细分领域的知识语料,互联网上是不全的。此外,由于存在政府换届、法律废止以及不同时期发展形势变化后的信息、文件对比和更新需求,大模型对数据和信息的提炼与提取能力就可以充分发挥出来。


Q:在哪些政务领域和场景应用大模型,可以被率先突破?有哪些通用筛选原则?


A:虽然国内现在政务领域看到的案例还不多,但 ChatGPT 的更新迭代非常快,应用也越来越广泛。


从个人视角来看,政务领域的大模型应用可以在三个方面率先突破,一是政务知识问答,这一点是切身感受得到的便利和价值。二是公文写作辅助,包括写作质量的评估、文案数据辅助等。三是数据驱动的分析研判。原来的数据是静态式的统计对比,现在大模型可以通过关联分析、辅助决策、产业布局优化、政策制定辅助等来支撑决策的科学性。


举个例子,比如政府某个年度有几个亿的预算作为企业补贴发放资金,但要补贴到哪些行业、哪些企业,以前这块工作非常难做,人的主观性、数据的滞后性以及影响补贴发放的客观性因素并不一定完全考虑到。现在只要知道补贴上线,大模型可以结合最新的国家政策、省、市、区级文件进行综合分析研判,然后给政府侧出具一个企业补贴标准的框架性建议,政府机构可以结合自身的决策流程与标准进行权衡。


另外就是预警研判,第一个场景是对整个辖区内的企业和经营数据的预警,比如问大模型这个辖区存在什么问题?可能会存在欠薪、培训机构携款潜逃、非法办学等问题,那么通过对这些问题进行分析,然后针对最新的投诉、新闻、征信、审判文书等数据,就可以实现快速对敏感企业进行定位。第二个场景是展会安保,比如可以结合注册信息、人脸识别或视频数据,叠加以往的治安数据,就可以对涉及纵火、极端事件、过往历史的人群进行识别,为展会安保提供决策支持。


Q:大模型将对政务服务、政府决策将产生哪些挑战?如何打破数据歧视、“AI幻觉”以及对偏见的固化等?


A:大模型跟传统数据库不一样,没有真正的记忆能力,无法记住原来处理过的信息,根据学习的数据分布,然后生成新的数据序列,来生成新的文本。所以才会有所谓“一本正经的胡说八道”。


如果大模型在底层训练的时候的算法和数据就存在人为植入的偏见,比如性别、种族、价值观等,从使基于底层模式的应用都可能被“污染”。一个人在什么样的环境中长大就会形成相应的性格色彩。


因此,在使用过程中,必须对大模型中的数据是否存在偏见有深刻的了解,因为政府才是客观事实依据的提供方与行为主体,机器不是,算法也不是。


大模型是黑箱子,如果决策依据不透明,大模型的使用将很容易失控。尤其当政务服务存在“不可解释性”,使用大模型就应该非常注意。


如何防止AI的认知幻觉与偏见,常用的方式是通过向量数据库来存储,并针对模型进行微调,裁剪有缺陷的部分和保留认可的部分。本地化部署在政务大模型的应用中很重要。


大模型是擅长“学习”,人类需要对它进行“教育”。


图片


Q:生成式 AI 应用是否会成为主流的政务服务入口,对现有政务数字化供给(比如原有信息系统、政务云的建设)会产生哪些冲击?


A:我们可以从 Win11 的应用创新来看,原来我们的电脑应用都是分散在桌面或文件夹里,而 Win11 操作系统在桌面的右边新增了一个叫做 Copilot 的对话框,可以看作是AI数字化助理。当我需要让它帮我写文件的时候,它就开始按要求写文件,当我需要订张明天的机票,它就可以开始帮我订票。原来需要用户通过多次点击才能获取的服务,现在通过大模型的对话框可以成为原来所有服务的第一交互入口。


所以从这个角度来看,生成式AI应用成为未来主流政务服务入口是很有可能的。从 PC 时代到移动互联网时代,政府网站与政务服务平台的信息、服务与数据已经足够丰富,而现在需要的是一个高效连接用户的方式,政务大模型应用则可以满足这样的需求。


但未来的生成式 AI 应用在政务服务领域具体长什么样现在还不好说清,但可能会有一个对话交互界面,通过 AI Agent 来调用 API 以实现政务服务交互,这样也将带来对原有政务服务内容的升级重构。比如我们目前的政务服务内容界面设计及要素是围绕用户搜索规则来设计的,那么,当生成式 AI 应用成为主流入口,未来的政务服务内容界面将会如何变化?假若在大模型主导的用户体验之下,我们又该如何来评价政务服务的优劣?以及如何评估政务服务的效能?


比如广州有一个药厂使用了用友的 ERP,他们想找我们用大模型给他们做一个企业的知识库,主要服务于整个药厂的采购、销售、内部管理等各个部门。比如我是公司总经理,以前我要一个公司的财务报表,需要通过财务总监,财务总监可能还得跟销售、采购部门等对接,这中间就可能出现一些人为干扰。现在通过大模型,一句话就可以了解公司三个月来的收入和支出报表。


大模型介入政务服务模式的改变,不只是对用户本身的影响,更重要的是对原有流程与决策机制会带来未知的变革。


图片