科技 苹果DCLM小模型霸主登场,超越Mistral 7B! 苹果刚刚发布了全新DCLM小模型,以70亿和14亿参数规模强势进入市场。这些开源模型的性能在多个基准测试中表现出色,备受关注。DCLM的全开源策略也吸引了大量网友的赞誉,预示着小模型市场的热潮即将来临。
科技 马斯克与扎克伯格的硅谷恩怨:从SpaceX火箭事故到开源大战 回顾马斯克与扎克伯格长达八年的硅谷恩怨,从SpaceX火箭爆炸到Facebook更名Meta,再到近期围绕Character AI的争锋,两人如何从商业竞争演变为私人对决。
科技 昆仑万维2022年净利润亮眼,AIGC布局成果显著 2月28日昆仑万维披露业绩快报,2022年净利润超预期。面对复杂环境展现韧性,核心业务发展强劲,AIGC战略布局有重大突破,发布开源项目获好评,还将发布中国版类ChatGPT并开源代码,推动AIGC生态建设。
科技 昆仑万维发布AIGC全系列算法与模型,引领行业发展 2022年12月15日昆仑万维发布「昆仑天工」AIGC全系列算法与模型并开源,旗下模型覆盖多模态。公司自2020年布局,各模型已开源。未来将提升内部业务内容生成能力,还探讨了AIGC商业化前景,其将借助全球用户等优势在AIGC赛道发力。
科技 DeepSeek赋能硬件革新:从PC到可穿戴设备全面AI化 DeepSeek通过开源和低成本模式,推动PC、手机、可穿戴设备、教育硬件乃至汽车座舱的AI化发展,显著降低AI使用门槛,实现普惠性技术革命。
科技 DeepSeek开源FlashMLA,突破H800性能上限 DeepSeek开源周首日公开FlashMLA,突破H800计算上限,降低算力成本,其创新注意力架构MLA成效显著,已在GitHub更新,获大量关注,还介绍了相关技术启发及优势。
科技 智谱AI:融资、开源与商业化的多重挑战 3月3日智谱宣布超10亿元融资,为IPO助力。面对DeepSeek冲击,智谱积极开源并调整商业化策略,虽取得一定成绩,但在竞争激烈的大模型市场仍面临诸多挑战,其未来发展受多方因素影响,充满不确定性。
科技 阿里开源新推理模型QwQ-32B,性能比肩DeepSeek-R1满血版 凌晨3点阿里开源QwQ-32B推理模型,参数量320亿,性能媲美6710亿参数的DeepSeek-R1满血版。通过大规模强化学习训练,在多基准测试中表现出色,还集成智能体相关能力,收获诸多好评,引发对端侧设备运行的讨论。