国产之光大模型DeepSeek今年春节期间在网络上爆红,DeepSeek展现出的不仅仅是超强的模仿能力,能以诙 […]
国产之光大模型DeepSeek今年春节期间在网络上爆红,DeepSeek展现出的不仅仅是超强的模仿能力,能以诙谐的幽默的口吻与网友各种调侃玩梗,他那极低的训练成本以及媲美顶尖水准的能力参数,也彰显了其极大的商业价值。
果不其然,爆红后不久,DeepSeek成为了众多云计算厂商纷纷争夺的重点。据不完全统计,目前已经有亚马逊云科技、阿里云、腾讯云、移动云等在内的国内外十几家云计算厂商上线了DeepSeek
在过去一年里,类似的情况早已屡见不鲜,尽管此次涉及的角色身份稍有差异,但模型之间竞争的本质并未改变。对于普通用户而言,使用新的 AI 产品十分简便,只需下载 APP 即可直接使用。然而,企业端的情况却大不相同。企业要部署 AI,首先需要购置价格高昂的硬件设备,其次要提供稳定的 API,再者还得构建面向用户端的应用并进行托管,更不必说针对企业私有数据的高阶定制优化了。与此同时,数据和模型的安全问题也让企业不得不加以考量。
概括来说,这些都属于企业在部署和使用模型过程中的工程化问题,具体涵盖成本、性能、安全,以及针对私有数据的定制优化、不同规模模型和不断增多的各种智能体的复杂调度等方面。
以 DeepSeek 为例,其公开的 V3 和 R1 模型有多种型号。其中,DeepSeek – R1 – Distill 系列模型的参数范围在 15 亿至 700 亿之间,而 R1 和 R1 – Zero 的参数规模则高达 6710 亿。一方面,不同参数规模的模型对计算性能的要求各异,企业必须对部署的硬件和软件进行精细调优,以保证模型在实际运行中能发挥出最佳性能;另一方面,企业在实际应用时,通常需要平衡 “响应速度” 与 “推理能力”,采用多级模型混合部署模式,这就使得企业还面临着异构计算资源的管理、跨云部署等难题。
在此情形下,降低企业部署大模型的门槛,已然成为云计算厂商提升市场竞争力的又一关键要素。据一位云计算厂商的售前技术人员向界面新闻透露,在 DeepSeek 之后,大模型的迭代速度将会加快,云计算厂商若想更迅速地帮助企业应用性能更优、成本更低的模型,就必须持续降低企业部署大模型的门槛。
灵活性和选择多样性是企业选择云平台部署大模型时的重要考量因素。为了降低企业部署大模型的门槛,云计算厂商也在不断探索灵活性和多样性方面的创新。
阿里云在上线 DeepSeek – R1 和 DeepSeek – V3 模型后,其 PAI Model Gallery 支持云上一键部署这两款模型,企业无需编写代码就能完成 AI 模型开发流程。企业相关工作人员只需登录阿里云 PAI 控制台,在 Model Gallery 页面的模型列表中挑选想要部署的 DeepSeek 系列模型,即可一键部署 DeepSeek 模型生成服务。目前,DeepSeek – R1 支持 vLLM 加速部署,DeepSeek – V3 支持 vLLM 加速部署以及 Web 应用部署,DeepSeek – R1 蒸馏小模型还支持采用 BladeLLM 和 vLLM 加速部署。这意味着在不同的计算资源和应用场景下,企业部署大模型的方式更为灵活。此外,阿里云的机器学习平台还为企业提供了自动化的机器学习工具,通过自动搜索模型参数和训练超参数的最优组合、低代码可视化建模等手段,降低了企业部署大模型的技术门槛。
亚马逊云则将重点放在助力企业客户实现多样化部署上,这源于其在大模型应用初期的洞察。亚马逊 CEO Andy Jassy 曾多次在公开场合表示,大模型行业不会出现一个模型独霸天下的局面。在基于大模型构建应用时,不同应用场景对技术指标的要求各不相同,延迟、成本、微调能力、知识库协调能力、多模态支持能力等,都会因场景需求的差异而有所取舍。经过多年发展,企业对大模型的应用越来越证实了这一判断。例如在快速响应场景中,DeepSeek R1 的深层思考模式显然不太适用,其生成首个 token 的用时超过 30 秒,而 Amazon Nova 仅需数百毫秒就能生成响应。并且,目前的 DeepSeek – V3 模型是文生文模型,不支持图形等多模态信息的输入,并非无所不能。基于这一理念,亚马逊云科技上线了 DeepSeek、AI21 Labs、Anthropic 和 poolside 等 100 多个重点领先厂商的模型,并提供了多样化的部署方式。以 DeepSeek 的部署为例,亚马逊云科技提供了 4 种方式,既能满足部分企业客户希望通过 API 快速集成预训练模型的需求,也能满足另一部分企业客户对高级定制或性价比的追求。
从整体趋势来看,降低模型训练和部署门槛,让企业无需具备深厚的 AI 经验就能调用大模型,已成为各家云计算厂商正在努力的方向。
AI crm erp ERP软件 MES OA系统 SaaS 中间件 二开平台 企业信息化 企业应用 企业应用开发 企业管理 企业软件 低代码 低代码中间件 低代码平台 低代码开发 低代码开发平台 低代码插件 低代码教程 信息化建设 信息化系统 免费crm 前端开发 后端开发 小程序开发 工信部 应用开发 开发工具 快速开发 教程 数字化 数字化转型 数据分析 数据可视化 数据库 数据集成 星云低代码 用友 私有化部署 系统对接 系统集成 软件企业 软件开发
云厂商集体上线DeepSeek——低代码一键部署或为焦点
国产之光大模型DeepSeek今年春节期间在网络上爆红,DeepSeek展现出的不仅仅是超强的模仿能力,能以诙 […]
国产之光大模型DeepSeek今年春节期间在网络上爆红,DeepSeek展现出的不仅仅是超强的模仿能力,能以诙谐的幽默的口吻与网友各种调侃玩梗,他那极低的训练成本以及媲美顶尖水准的能力参数,也彰显了其极大的商业价值。
果不其然,爆红后不久,DeepSeek成为了众多云计算厂商纷纷争夺的重点。据不完全统计,目前已经有亚马逊云科技、阿里云、腾讯云、移动云等在内的国内外十几家云计算厂商上线了DeepSeek
在过去一年里,类似的情况早已屡见不鲜,尽管此次涉及的角色身份稍有差异,但模型之间竞争的本质并未改变。对于普通用户而言,使用新的 AI 产品十分简便,只需下载 APP 即可直接使用。然而,企业端的情况却大不相同。企业要部署 AI,首先需要购置价格高昂的硬件设备,其次要提供稳定的 API,再者还得构建面向用户端的应用并进行托管,更不必说针对企业私有数据的高阶定制优化了。与此同时,数据和模型的安全问题也让企业不得不加以考量。
概括来说,这些都属于企业在部署和使用模型过程中的工程化问题,具体涵盖成本、性能、安全,以及针对私有数据的定制优化、不同规模模型和不断增多的各种智能体的复杂调度等方面。
以 DeepSeek 为例,其公开的 V3 和 R1 模型有多种型号。其中,DeepSeek – R1 – Distill 系列模型的参数范围在 15 亿至 700 亿之间,而 R1 和 R1 – Zero 的参数规模则高达 6710 亿。一方面,不同参数规模的模型对计算性能的要求各异,企业必须对部署的硬件和软件进行精细调优,以保证模型在实际运行中能发挥出最佳性能;另一方面,企业在实际应用时,通常需要平衡 “响应速度” 与 “推理能力”,采用多级模型混合部署模式,这就使得企业还面临着异构计算资源的管理、跨云部署等难题。
在此情形下,降低企业部署大模型的门槛,已然成为云计算厂商提升市场竞争力的又一关键要素。据一位云计算厂商的售前技术人员向界面新闻透露,在 DeepSeek 之后,大模型的迭代速度将会加快,云计算厂商若想更迅速地帮助企业应用性能更优、成本更低的模型,就必须持续降低企业部署大模型的门槛。
低代码、多样化部署成为趋势
灵活性和选择多样性是企业选择云平台部署大模型时的重要考量因素。为了降低企业部署大模型的门槛,云计算厂商也在不断探索灵活性和多样性方面的创新。
阿里云在上线 DeepSeek – R1 和 DeepSeek – V3 模型后,其 PAI Model Gallery 支持云上一键部署这两款模型,企业无需编写代码就能完成 AI 模型开发流程。企业相关工作人员只需登录阿里云 PAI 控制台,在 Model Gallery 页面的模型列表中挑选想要部署的 DeepSeek 系列模型,即可一键部署 DeepSeek 模型生成服务。目前,DeepSeek – R1 支持 vLLM 加速部署,DeepSeek – V3 支持 vLLM 加速部署以及 Web 应用部署,DeepSeek – R1 蒸馏小模型还支持采用 BladeLLM 和 vLLM 加速部署。这意味着在不同的计算资源和应用场景下,企业部署大模型的方式更为灵活。此外,阿里云的机器学习平台还为企业提供了自动化的机器学习工具,通过自动搜索模型参数和训练超参数的最优组合、低代码可视化建模等手段,降低了企业部署大模型的技术门槛。
亚马逊云则将重点放在助力企业客户实现多样化部署上,这源于其在大模型应用初期的洞察。亚马逊 CEO Andy Jassy 曾多次在公开场合表示,大模型行业不会出现一个模型独霸天下的局面。在基于大模型构建应用时,不同应用场景对技术指标的要求各不相同,延迟、成本、微调能力、知识库协调能力、多模态支持能力等,都会因场景需求的差异而有所取舍。经过多年发展,企业对大模型的应用越来越证实了这一判断。例如在快速响应场景中,DeepSeek R1 的深层思考模式显然不太适用,其生成首个 token 的用时超过 30 秒,而 Amazon Nova 仅需数百毫秒就能生成响应。并且,目前的 DeepSeek – V3 模型是文生文模型,不支持图形等多模态信息的输入,并非无所不能。基于这一理念,亚马逊云科技上线了 DeepSeek、AI21 Labs、Anthropic 和 poolside 等 100 多个重点领先厂商的模型,并提供了多样化的部署方式。以 DeepSeek 的部署为例,亚马逊云科技提供了 4 种方式,既能满足部分企业客户希望通过 API 快速集成预训练模型的需求,也能满足另一部分企业客户对高级定制或性价比的追求。
从整体趋势来看,降低模型训练和部署门槛,让企业无需具备深厚的 AI 经验就能调用大模型,已成为各家云计算厂商正在努力的方向。
制造企业如何选择合适的生产管理系统?
国务院国资委:大力推进国有企业数字化转型及“AI+”专项行动
热门文章
相关推荐
猜你喜欢
热门标签
AI crm erp ERP软件 MES OA系统 SaaS 中间件 二开平台 企业信息化 企业应用 企业应用开发 企业管理 企业软件 低代码 低代码中间件 低代码平台 低代码开发 低代码开发平台 低代码插件 低代码教程 信息化建设 信息化系统 免费crm 前端开发 后端开发 小程序开发 工信部 应用开发 开发工具 快速开发 教程 数字化 数字化转型 数据分析 数据可视化 数据库 数据集成 星云低代码 用友 私有化部署 系统对接 系统集成 软件企业 软件开发