周周向上.AI大模型笔记(1):15个常见的错误认知
· 阅读需 15 分钟
注:本文于2024年8月7日发表于微信公众号《周周向上.AI》及《周周向上》中。
引言
我从GPT3.5发布起开始研究AI大模型,先期主要探索各种用法,从会话应用到数字人,无不尝试;随后则跟着专家大咖们系统的学习和开发AI大模型,从PE到FT,各种技术都用过;也亲身部署/调用过N个大模型、开发了几十款应用、做了大量的调研,算是兼具了大模型研究者、使用者和开发者的多重身份和视角。
从我的切身经验看,AI大模型的能力的确是非常强大,能够快速且大幅的提升部分场景下的生产力和生产效率,但门槛(无论是使用门槛还是技术门槛)却并不高——而这个高价值、低门槛的特性,或许将使AI大模型成为组织乃至大众创业创新的新一代基础设施(本文借用大模型术语称为“能力底座”)。
这是前所未有的机遇,或许能给很多人带来新的希望、动力和方向。但在开始运用这个“能力底座”之前,应对其有基本的、客观的了解,尤其要先从各种信息洪流中抽离出来,避免一些常见的错误认知。
(文中涉及的一些术语,比如与原理相关的transformer架构等,与能力相关的参数/权重、训练数据等,与应用相关的提示词、微调等,与成本相关的GPU、token等,AI答的比我好,不赘述。)
