跳到主要内容

6 篇博文 含有标签「AI大模型」

查看所有标签

周周向上.AI大模型笔记(2):组织AI战略认知之高管篇

· 阅读需 16 分钟
周永峰_治土安人.AI
周周向上人工智能工作室

引言

随着AI成为时代标配,许多组织在该领域投入巨大,但最终成果却常常局限于优化边缘环节:一个更智能的客服、一个能辅助撰写周报的助手,或一个内部知识库。这些应用虽有很大价值,却远未触及AI改造核心业务的巨大潜力。

这种投入与产出间的落差,其根源往往不在技术层面,而在于对AI的认知深度。

目前来看,影响AI在组织中充分发挥效能的最大因素依然是认知。 ——周周向上.AI实战札记

在上一篇梳理了15个常见的错误认知后,本篇将聚焦于问题的核心:高管作为组织AI战略的“第一推动力”,其认知高度决定了AI项目的起点与天花板。我们将深入探讨高管认知升级的关键,以确保组织的AI投入能够真正驱动核心业务变革,而非仅仅停留在看似很AI的“高级工具”层面。

一、高管认知是组织AI战略的“第一推动力”

在组织中引入AI,不仅仅是技术升级,更是组织战略和管理范式的变革。很多组织在AI转型中“走弯路”,根本原因往往不是技术失误,而是对AI的本质、能力边界和落地路径缺乏更清晰的认知。

认知不到位,往往源于一种“界面错觉”。当前AI大模型最广为人知的形态是其强大的会话能力,这既是普及的催化剂,也容易形成第一层认知:将“AI能力建设”简单等同于“做一个聊天机器人”。

一个稍微进阶、也是更常见的第二层认知,是将其核心价值局限在一系列“高级工具”的应用上。

这其中最典型的就是利用RAG技术构建“智能知识库”,此外还包括做数据分析、周报生成、代码辅助、文案起草等。这些应用的共性是,将AI作为提升局部效率的“辅助工具”,来优化一个既有的、相对独立的环节。这些应用无疑是AI落地的有效路径,但其价值主要体现在对现有流程的优化上。

若要充分释放AI的颠覆性潜力,则需要将认知推向更深层次:也就是将AI大模型的核心能力与组织的核心业务流程深度融合,去重塑、甚至创造全新的价值链。如果认知未能从“工具提效”上升到“流程再造”,投入的资源所产生的效果,可能更多地体现在局部效率的优化上,而对客户转化率、生产效率等核心业务指标的提升相对有限,这也可能影响组织内部对AI长远价值的信心与投入决心。

做AI大模型相关开发≠软件工程+提示词工程,甚至≠软件工程+传统AI工程+提示词工程,这中间的GAP是很大的。 ——周周向上.AI实战札记

因此,高管认知是组织AI战略的“第一推动力”,只有高管认知到位,才能带动战略共识、资源配置、组织氛围的全面升级,为AI项目的持续落地和价值释放打下坚实基础。

二、高管认知升级的关键内容

我在调研了很多组织后发现,高管认知升级可以先聚焦以下几个关键内容:

首先,深刻理解AI与传统信息化的本质区别。 传统信息化系统追求“确定性”,而AI系统则擅长“概率性推理”和“多轮动态优化”;传统系统强调“规则驱动”,而AI系统则强调“数据驱动+HIAI协作”。高管需要把AI当成一个极具潜力但需要引导的“管培生”,而不是一台永不出错的精密设备。

人们很自然的会将AI系统等同于传统的信息化系统,从而期望能够一次性输出‘理想’结果,但却总忘记AI系统是可以通过多轮‘迭代’来快速趋近‘更理想’结果的…… ——周周向上.AI实战札记

其次,科学认知AI的战略价值、能力边界与风险。 AI不是万能神丹,它在不同业务流程中的应用价值也各不相同。其核心优势在于强大的语言理解知识整合内容生成能力,尤其擅长对海量的、非结构化的信息进行深度加工,以辅助人类完成需要综合分析、归纳总结和创新构思的复杂任务。例如,作者[注]的实战经验表明:用AI大模型来构建复杂的岗位能力模型、定向生成针对性的内容、进行能力评估,在经过多轮动态优化后,效率可以得到数倍提升,能力水平可以媲美专业顾问;但若期望它替代产线上需要“零差错”的精密物理操作,则可能会带来很大的风险。因此,我们需要扬长避短,并正视其“幻觉”与“不确定性”,通过有效的机制设计将其控制在可接受的范围内。

正如我在朋友圈中所说:“AI大模型能做什么这个问题真的很难回答……一个正确的思考方向或许是:我想做什么?让AI先试试…” ——周周向上.AI实战札记

再次,做好组织AI战略的顶层设计。 这要求高管们首先明确AI的战略定位:究竟是作为优化现有业务的“效率工具”来降本增效,还是作为探索新商业模式的“增长引擎”来创新业务?定位决定方向。在此基础上,必须建立相应的AI治理机制——这是确保AI这匹“快马”跑得又快又稳的“缰绳”,涵盖数据安全、算法合规、伦理边界和风险管控等多个维度。也需要规划清晰的能力建设路径,是选择借力外部成熟方案快速起步,还是立足长远孵化内部团队;是从小范围的试点项目开始验证价值,再逐步推广到全公司,都需要系统性的规划。

最后,规避典型的认知误区。 这包括:警惕“技术万能论”,期待AI能“一步到位”解决所有沉疴积弊;重技术、轻组织,忽视了配套的流程再造和人才培养;陷入对“最强大模型”的盲目追逐,而脱离了具体的业务场景和数据基础…等等。

总之,建议高管以“战略定位+组织变革+技术实施”三位一体的系统性视角来推动AI落地,才能让AI投资真正转化为可持续的业务增长和核心竞争力,而不是昙花一现的技术展示。

三、实战案例/行业观察

  • 案例1:企业级AI系统开发中的认知误区
    在开发“员工安全生产能力智能评估系统”时,我初期尝试了用自然语言会话作为主要的人机交互方式,但发现在严谨的流程场景下,自然语言会话反而是效率低下的、多歧义的、对管理员能力要求高的。经过深入讨论和反复探索,我们最终决定采用“AI核心+传统界面”的模式,将AI的能力用在“刀刃上”(如能力建模、内容生成与能力评估),而不是盲目追求“看起来很AI”的交互。

  • 案例2:垂域大模型研发项目的认知转变
    在“土粒儿大模型”的研发过程中,我最初也曾陷入“模型越大越好”的误区,期望一步到位。但实践中发现,针对土壤修复这一特定领域,数据的质量、模型的微调策略、与专家经验的结合,远比单纯追求大参数量更重要。这一认知转变,帮助我研发出了更加轻量、高效、精准的垂域模型。

四、经验总结与行动建议

我们认为,对于高管来说,认知升级不能只停留在“知道”,更要转化为“行动”。我们建议您从两个更有针对性的行动开始:

第一,“带着业务问题去对话”。 当您再次打开任何AI会話工具时,请不要只把它当作信息查询的入口。尝试输入一个您正在面临的真实业务挑战,例如:“我是一家制造业公司,如何将成品良品率从95%提升到97%?请给出三种不同的策略,并分析其优劣。” 然后观察AI如何进行“思考”、整合信息、提出结构化方案。您要体验的不是它的“对话能力”,而是它作为“初级战略顾问”的潜力。

第二,“寻找并拆解一个‘嵌入式’AI应用”。 主动要求您的团队或IT部门,为您演示一个已经将AI能力嵌入到系统或流程中的例子(而不是一个独立的聊天框)。比如,ERP系统中自动预测库存风险,或是在CRM里自动生成客户跟进邮件的初稿,或者用我开发的《员工安全生产能力智能评估系统》来给岗位建立一个能力模型…总之,您要观察的不是AI的答案多惊艳、风格怎么这么像人类,而是它如何优化了某个具体环节的效率和决策质量。

通过这种针对性行动,才能真正穿透AI的表象,建立起“AI如何为我所用”的深度认知。

  • 推荐阅读/延伸案例/互动提问
    • 推荐阅读:《周周向上.AI大模型笔记(1): 15个常见的错误认知》
    • 延伸案例:详见“员工安全生产能力智能评估系统”、“土粒儿大模型”、“Safer多模态大模型”等项目实践(后几个在我的视频号《周周向上》中都有,员工安全生产能力智能评估系统的视频也会尽快做好发布)。
    • 互动提问:你所在组织的高管团队,对AI大模型的认知处于什么阶段?你认为最大的认知障碍是什么?欢迎留言交流。

预告:下一篇《组织AI战略认知·中层篇》,将聚焦中层的AI认知升级与组织赋能,敬请关注!


注:本文作者 周永峰 先生系AI大模型全栈工程师、PMP项目经理,具有EHS、制造、服务、工程等多重专业背景。在AI领域的典型成果有:员工安全生产能力智能评估系统、智能CRM与销售系统、垂域文本大模型土粒儿、垂域多模态大模型Safer、AI大模型处理图数据库技术、基于AI大模型的非结构化数据提取及增强技术等。


联系我们

如需交流AI战略、预约系统演示或获取更多资料,欢迎联系:

  • 微信/手机:18049700567(周先生)
  • 邮箱:18049700567@163.com
  • 扫码直联(验证请填写事由及贵公司名称):
微信二维码

周周向上.AI大模型笔记(1):15个常见的错误认知

· 阅读需 15 分钟
周永峰_治土安人.AI
周周向上人工智能工作室

注:本文于2024年8月7日发表于微信公众号《周周向上.AI》及《周周向上》中。

引言

我从GPT3.5发布起开始研究AI大模型,先期主要探索各种用法,从会话应用到数字人,无不尝试;随后则跟着专家大咖们系统的学习和开发AI大模型,从PE到FT,各种技术都用过;也亲身部署/调用过N个大模型、开发了几十款应用、做了大量的调研,算是兼具了大模型研究者、使用者和开发者的多重身份和视角。

从我的切身经验看,AI大模型的能力的确是非常强大,能够快速且大幅的提升部分场景下的生产力和生产效率,但门槛(无论是使用门槛还是技术门槛)却并不高——而这个高价值、低门槛的特性,或许将使AI大模型成为组织乃至大众创业创新的新一代基础设施(本文借用大模型术语称为“能力底座”)。

这是前所未有的机遇,或许能给很多人带来新的希望、动力和方向。但在开始运用这个“能力底座”之前,应对其有基本的、客观的了解,尤其要先从各种信息洪流中抽离出来,避免一些常见的错误认知。

(文中涉及的一些术语,比如与原理相关的transformer架构等,与能力相关的参数/权重、训练数据等,与应用相关的提示词、微调等,与成本相关的GPU、token等,AI答的比我好,不赘述。)

15个常见的错误认知

我从自己踩过的那些坑(经验教训)以及长期系统化的学习实战中,筛选出了现阶段比较常见的、关于AI大模型认知方面的典型问题(本文权且称为"错误认知"),涉及现状、原理、选型、开发、使用以及趋势等多个方面,现整理成文,仅供参考,同时欢迎讨论。

错误认知0:ChatGPT是AI

ChatGPT是基于OpenAI GPT系列大模型开发的会话式应用,不是AI;GPT系列大模型如GPT-3.5、GPT-4、GPT-4o、GPT-4o-mini等,这些是AI;同样的,kimi、文心一言等等,也都不是AI,而是应用。

错误认知1:AI是导致裁员的主要原因

从多方反馈来看,AI并不是大部分组织裁员的主要原因。AI大模型目前能承担的主要还是助手(copilot)类角色,无法完全胜任一个人类的工作岗位。但有两种情况可能要特别注意:一种是容错率较高的工作,一种是简单重复的工作(如一岗多人)。

错误认知2:AI生成的内容都是可靠的

AI生成的内容是否可靠(置信度有多高),既与具体任务有关,也与模型能力以及开发、使用水平有关。经验上看,选择参数量更大的主流模型,或者选择专门针对某个任务/专业/行业微调好的模型和开发好的应用,辅之以恰当的使用方法,置信度会更高。

错误认知3:AI有幻觉,所以没有用

“AI幻觉”是由其底层架构决定的(详情可AI一下transformer架构),而这个架构已被证明能够成功训练出GPT能力级别的大模型(也有其他架构,但能否训练出来GPT级能力待证明,但证明成本太高)。所以想要使用AI大模型能力,就必须面对其有“幻觉”的事实。好在“AI幻觉”虽不能根除,但有技术可以抑制,后续会专门写文章介绍。

错误认知4:AI可以适用于所有场景

AI大模型有极其擅长的领域但也有自己的能力边界,一些常规任务也并不需要用到大模型,传统系统或者小模型或许更能满足需求或解决问题。但所有需求和问题都值得用大模型试试。也有观点认为,AI大模型更适合提供底层能力而不是具体的应用,也有一定道理。

错误认知5:国外模型普遍比国产的好

倒也不必妄自菲薄。目前综合能力最强的大模型的确是在国外,但其他国外模型与最强相比也有差距,而主流国产模型的排名也很靠前。另外相当多的国外模型对中文的支持很不理想(中文语料占比过低所致),直接生成的中文内容可读性不强。

错误认知6:闭源模型更强,开源模型是智商税

这个观点是国内某大厂李姓厂长提出的,有他自身的考量。目前依然不断有能力更强的模型开源,是不是智商税不知道,但很多人都觉得比李厂长家的好用。

错误认知7:模型参数越大,效果越好

一般来说是的,但不完全是:大家最爱用的一个证据是埃隆·马斯克开源的Grok-1:314b(3140亿参数),实际使用效果据说仅与GPT3.5相当(1750亿参数)。一些专业的小参数模型对于特定任务的效果也很好。

错误认知8:训练数据越多,效果越好

训练数据的规模和质量同等重要,规模大但质量低的训练数据可能会导致过拟合,削弱大模型的泛化能力(可类比为举一反三的能力)。

错误认知9:模型排名越高,效果越好

目前除个别排行榜还有些权威性之外,其他的仅做参考就行,毕竟现在针对特定评测指标“刷榜”几乎成了一部分大模型厂商的“常规”操作。

错误认知10:微调后的模型效果更好

也不一定。实际上很多有经验的开发者在面对具体需求时并不赞成优先考虑微调,可选的技术路径有很多,大多都比微调的综合成本和风险低。

错误认知11:私有化部署比付费调用便宜

两者都是接入AI大模型能力的方法,但成本结构不一样。付费调用(闭源/开源模型都可以)一般是以token计费,大多输入输出双向计,用多少抵多少但用量不太好控制;私有化部署(只有开源模型可以)则要买/租算力(主要是GPU)和做部署、运维等,诸如并发、安全、合规等等细节都需要自己做,这些也都是成本。所以综合成本哪个更低,还是要看具体需求。

错误认知12:AI能编程就能自主开发软件

理论上可以,现阶段还不行;有一些项目在这个方向尝试过,截至目前进展不大。所以想完全用AI开发或重构软件的朋友,还得再等等。

错误认知13:一套提示词适用于所有大模型

由于各个模型的训练数据不同、参数(权重)不同,所以适用的提示词也不尽相同,即便是同一模型的不同版本也是如此。建议在更换模型时重新测试,必要时更新或重写提示词。

错误认知14:使用效果的好坏全看模型能力

无论是亲身实践还是大咖经验,都证明最终使用效果是由使用者与AI大模型的协作水平决定的,符合木桶原理(短板理论)。所以从这一点看,使用者的认知、用法、知识和判断力等,与大模型的能力同样重要。

错误认知15:AI只能降本提效,没有创造新价值

从调研结果看,使用AI大模型降本提效的组织,比观察到的甚至预想到的都要多;而用AI创造新产品、新服务并已取得商业成功的,看似不多实则也不少,不过有些是“悄悄”的、有些是针对特定用户群体的、有些则是有很强专业属性的,故而不为大众所知。

以上就是整理出来的15个所谓“错误”认知,当然这种正确/错误并没有什么严格区分,仅针对业务目标而言,也仅局限在当前阶段。不妥之处,欢迎指正。

后记

这篇短文我手搓了三天,中间有些是我自己的经验教训,有些是听了专家大咖的分享后又做了验证,总之都是来自亲身实践,一般问AI是问不到的。但现在带着这些线索再去问,AI可能就会给出更圆满的回答。所以若有些描述不清或思虑不周的地方,请再问下AI。

当然,如果不求“亲身”二字,直接用大模型生成,速度会相当快,行文也会更流畅更规范,但总觉得少了点什么,或许是真诚?在AI时代还手搓文字,可能是一个从PC时代走过来的自媒体人最后的倔强吧。

是为记。(正文完)

注:《周周向上》、《周周向上吧》与《周周向上.AI》等三个微信公众号均是我本人创办的专业自媒体。其中《周周向上》2012年创办,主要服务于土壤修复;《周周向上吧》2018年创办,主要服务于安全管理;《周周向上.AI》2024年创办,主要服务于AI大模型。三个专业自媒体都是应时而生,所探讨的也都是彼时的前沿内容。

《周周向上.AI》创办的初衷,旨在唤起国内公众对于AI大模型的热情,通过拉齐认知、降低门槛来推动公众应用AI和创新AI的浪潮,通过群体力量来缩小与国外的差距。更为重要的是,这个自媒体将致力于研究用AI创造「新」价值,而不是卷上加卷、雪上加霜,符合我所认为的、AI发展的正确方向。


预告:下一篇《周周向上.AI大模型笔记(2):组织AI战略认知·高管篇》,将聚焦高管的认知升级,敬请关注!


本文作者 周永峰 先生系AI大模型全栈工程师、PMP项目经理,具有EHS、制造、服务、工程等多重专业背景。在AI领域的典型成果有:员工安全生产能力智能评估系统、智能CRM与销售系统、垂域文本大模型土粒儿、垂域多模态大模型Safer、AI大模型处理图数据库技术、基于AI大模型的非结构化数据提取及增强技术等。


联系我们

如需交流AI战略、预约系统演示或获取更多资料,欢迎联系:

  • 微信/手机:18049700567(周先生)
  • 邮箱:18049700567@163.com
  • 扫码直联(验证请填写事由及贵公司名称):
微信二维码

DeepSeek的社会影响

· 阅读需 2 分钟
周永峰_治土安人.AI
周周向上人工智能工作室

DeepSeek这波全球出圈,其影响远远不止技术层面,更多的可能是在社会层面。

1、世界广泛认可的DS让技术人员欣喜万分(周周向上.AI之前研究出来的一项技术也得到了印证,原来在大尺寸模型中不仅是work的,而且会有那么炸裂的效果)。DS证明了在资源受限下的某些路径可行,而且能大有作为。

2、而开源了的DS正在让所有人无门槛的使用目前蓝星最强大的AI之一,引发对AI和未来的深度思考,进而加速推进文明的进程…在这个层面的影响简直不可估量。

这才是人类科技树的正确点法…DS应该与其他璀璨的AI先行者们一起,记入AI发展史乃至人类文明史。

DS,YYDS~

DeepSeek的成本辨误

· 阅读需 2 分钟
周永峰_治土安人.AI
周周向上人工智能工作室

DeepSeek被封神已毋庸置疑,但各路营销号们似乎混淆了一些东西…

比如,训练成本557.6万刀,此数字出自V3的技术报告,应该指的是V3模型,并不是爆火的那个R1模型(也就是自带长思维链的那个推理模型),并且是按照租卡方式折算出来的(跟自己购卡成本不同),也只是正式在卡上跑的成本(不包含前期很多投入)…

请注意:这已经非常了不起了,相信大部分公司就算拿到了所有数据,在1000万刀以内恐怕也做不出来DS同样的效果…

DS在这波里已经很神了,尤其是给伙伴们证实了一条可以走得通的新路径,也就是即便在算力受限的情况下,通过打磨算法和数据,也能做出来非常好的东西。

DS,YYDS~

AI大模型处理图数据库技术发布

· 阅读需 2 分钟
周永峰_治土安人.AI
周周向上人工智能工作室

技术简介

  • 技术名称:AI大模型处理图数据库
  • 技术全名:基于AI大模型的自然语言处理和图数据库技术
  • 完成时间:2024年11月
  • 用途:根据岗位JD一键生成知识图谱并实现自然语言增删改
  • 说明:该类技术用途广泛,可以进一步扩展为AI大模型处理各类数据库、打通各类系统等。

团队信息

  • 研发团队:周周向上人工智能工作室(筹)
  • 技术总师:周永峰(AI大模型全栈工程师,美国PMI认证项目经理)

联系方式

微信二维码

周周向上推出AI大模型专项服务

· 阅读需 5 分钟
周永峰_治土安人.AI
周周向上人工智能工作室

本部分阐述了目前我们可以对外提供的服务,欢迎联系:

服务内容

  • AI大模型技术研发/咨询
  • AI大模型智能工具开发
  • AI大模型解决方案定制与项目管理

典型业绩

AI技术研发/咨询

  • 基于AI大模型的非结构化数据提取及增强技术
  • 垂域文本大模型微调(LoRA)与量化技术
  • 多模态垂域大模型微调数据集智能构建技术
  • 多模态垂域大模型高效调优技术
  • 大模型高效压缩(蒸馏)技术
  • 大模型高效压缩(剪枝)技术[进行中]
  • 基于AI大模型的技能测评技术
  • 基于AI大模型的精准培训技术
  • 基于AI大模型的自然语言处理知识图谱技术
  • 基于AI大模型的安全隐患排查技术

AI系统/智能工具/应用开发

  • 员工安全生产能力智能评估系统
  • 智能CRM与销售系统
  • 垂域文本大模型Tulier-instruct
  • 垂域多模态大模型Safer-V
  • AI大模型垂域工具(10+),智能知识库、票据识别、数据分析、知识资产激活、专利起草、项目管理、知识挖掘、智能客服、安全培训、土壤修复、技术翻译等。
  • 零基础上手玩赚ChatGPT》网络课程

解决方案定制与项目管理

  • 某咨询公司AI大模型专项产品解决方案及项目管理
  • 某建筑公司AI智能知识库建设解决方案及项目管理
  • 某制造公司AI大模型能力建设解决方案及项目管理
  • 某环境公司AI大模型私有部署解决方案及项目管理

商务事宜

  • 研发/咨询类服务(含内训等)按“工时单价×工作日”取费,其余服务另行商议。
  • 在 周周向上人工智能工作室 筹备期间,统一由 上海青鹏环境工程技术有限公司 开具“技术服务”类目增值税普通发票。

技术总师:周永峰先生

周永峰先生是AI大模型全栈工程师、解决方案专家、美国PMI认证项目经理。

周永峰先生在AI大模型领域拥有丰富经验,对AI大模型业态和主流产品十分熟悉,擅长AI大模型技术研发、智能应用开发和提供AI大模型解决方案。现已在多个研发专项上实现了技术创新或技术突破,并成功开发垂域文本大模型、垂域多模态大模型以及十余款智能化工具/应用,所提供的AI大模型解决方案已帮助多个组织实现了降本增效和业绩增长。

周永峰先生曾在以下组织担任要职:

  • 周周向上人工智能工作室(筹),创始人
  • 上海瑞迈咨询,安全SaaS负责人
  • 上海青鹏环境,合伙人,副总经理
  • 专业自媒体《周周向上》,创办人
  • 上海环境科学学会专委会,副理事长
  • 江苏平方集团,合伙人,副总经理

联系方式

微信二维码