字節跳動為Seed部門大模型技術員工實施期權增發計劃,按績效和職級差異,員工每月可獲9萬、11萬或13萬元期權,持續18個月,累計總量達100萬元人民币。
蘇甯易購“靈思”大模型升級,實現核心算力國産化,提升業務效率和零售需求匹配,推理效率提升30%,訓練成本下降70%,全面賦能零售智能化升級。
沙利文報告顯示,2025年上半年中國企業級大模型日均調用量較2024年底增長363%,突破10萬億Tokens,阿里通義以17.7%份額領跑。
LongCat-Flash采用創新性混合專家模型(Mixture-of-Experts,MoE)架構,總參數560B,激活參數18.6B-31.3B(平均27B),實現計算效率與性能的雙重優化。
該公司成立于2025年3月,經營範圍包含人工智能基礎軟件開發,信息繫統集成服務,人工智能應用軟件開發;智能機器人的研發等。
DeepSeek已決定使用華為的人工智能芯片來訓練其部分模型,反映其正在減少對英偉達芯片的依賴。
該模型僅需一張靜态圖片和一段音頻,即可生成面部表情自然、口型一致、肢體動作絲滑的電影級數字人視頻。
“但中國公司将是最強勁的競争對手,因為他們的電力比美國多得多,而且在硬件建設方面實力超強。”
九方智投子公司入駐“模速空間”,與騰訊雲計算合作開發AI企業工具,推動數字化轉型和AI技術研發。
VeOmni采用以模型為中心的分布式訓練方案,可将復雜的分布式並行邏輯與模型計算解耦,為全模态模型組合設置高效的並行訓練方案。
昆侖萬維8月12日開源升級版世界模型Matrix-Game 2.0,顯著提升跨場景長時視頻的時序一致性,支持連續指令輸入。
據介紹,該模型依托盾構/TBM工程大數據中心773條工程線路,1200億條工程建造數據,構建了通用大模型調度中小模型驅動的垂直領域大模型技術體繫。
小紅書發布中國開源首個視覺語言模型dots.vlm1,基于12億參數視覺編碼器和DeepSeek V3 LLM構建,在視覺感知與推理領域達到準SOTA水平。該模型通過大規模預訓練實現高效性能,標志着AI視覺技術的重要突破。
8月7日,阿里通義千問發布Qwen3-4B-Instruct-2507與Qwen3-4B-Thinking-2507,前者非推理性能超越閉源GPT4.1-Nano,後者推理能力接近30B級模型,已在魔搭社區及HuggingFace開源。
亞馬遜宣布将在Bedrock和Sagemaker平台首次提供OpenAI全新開放權重模型,CEO Andy Jassy稱AWS将成企業AI工具超市。
阿里開源全新文生圖模型Qwen-Image,當天即登上全球最大的AI開源社區HuggingFace的模型榜單首位,成為全球熱度最高的開源模型。
阿里雲開源推出20B參數圖像生成模型Qwen-Image,采用MMDiT架構提升文本渲染與圖像編輯精度。作為通義千問繫列首個圖像基礎模型,其開源特性将加速AI技術研發與産業落地。