บริษัทสตาร์ทอัพด้าน AI ของจีน DeepSeek ได้ประกาศอัปเดตโมเดลปัญญาประดิษฐ์ DeepSeek V3.1 เมื่อวันอังคารที่ผ่านมา โดยเวอร์ชั่นใหม่นี้มีการเพิ่มขีดความสามารถ เช่น ขยายขนาด context window ให้กว้างขึ้น ช่วยให้การจดจำข้อมูลในการสนทนาและการวิเคราะห์เอกสารดีขึ้นกว่าเดิม บริษัทฯ ให้รายละเอียดเทคนิคเพียงเล็กน้อยผ่านช่องทาง WeChat ของตัวเอง และยังไม่ได้เผยแพร่เอกสารเกี่ยวกับเวอร์ชั่นใหม่ในแพลตฟอร์มหลักอย่าง Hugging Face
การประกาศครั้งนี้เกิดขึ้นในขณะที่ DeepSeek กำลังเผชิญกับแรงกดดันเรื่องการเลื่อนเปิดตัวโมเดล R2 ที่ได้รับการคาดหวังสูง โดย CEO ของบริษัทออกมาแสดงความไม่พอใจต่อประสิทธิภาพของ R2 เวอร์ชั่นปัจจุบัน ปัจจัยที่ทำให้เกิดความล่าช้า ได้แก่ ความพิถีพิถันในการพัฒนาและปัญหาทางเทคนิค โดยเฉพาะอย่างยิ่งการฝึกโมเดลกับชิป Ascend ของ Huawei ตามข้อกำหนดของรัฐบาลที่ต้องการผลักดัน AI ที่พึ่งพาตนเอง แต่เกิดอุปสรรคทางเทคนิคในการฝึกโมเดลบนฮาร์ดแวร์นี้ DeepSeek จึงยังต้องใช้ชิป Nvidia ขณะที่ชิป Ascend ใช้สำหรับงาน inference เท่านั้น
DeepSeek กลายเป็นคู่แข่งสำคัญในแวดวง AI โดยสามารถสร้างโมเดลที่มีประสิทธิภาพสูงในงบประมาณต่ำมาก เช่น โมเดล R1 ที่ออกเมื่อต้นปีนี้ใช้เงินพัฒนาแค่ประมาณ $5.6 ล้าน แต่กลับได้ผลลัพธ์ดีเยี่ยมในมาตรฐานระหว่างประเทศ สร้างแรงสั่นสะเทือนให้กับวงการเทคโนโลยีในสหรัฐฯ และส่งผลต่อราคาหุ้นบริษัท AI ใหญ่ ๆ อย่าง Nvidia อย่างไรก็ตาม รายงานล่าสุดระบุว่าการใช้งาน DeepSeek ลดจาก 50% เมื่อต้นปีเหลือเพียงประมาณ 3% เนื่องจากคู่แข่งอย่าง Qwen3 ของ Alibaba นำนวัตกรรมใหม่ไปใช้และได้ประสิทธิภาพสูงกว่า
ขอบคุุณข้อมูลจาก : Routers , Bloomberg










