DeepSeek 是一家中國人工智慧公司,由梁文峰於 2023 年 7 月創立,他此前曾共同創立對沖基金 High-Flyer。該公司專門開發開源大型語言模型 (LLM),並憑藉其可與 OpenAI 和 Meta 等老牌公司相媲美的經濟高效的解決方案迅速在人工智慧領域佔據一席之地。
DeepSeek 擁有 200 名員工,主要由北京大學、清華大學和浙江大學等中國知名大學的應屆畢業生組成。該公司更重視技術技能而不是豐富的工作經驗,吸引渴望為克服全球技術障礙做出貢獻的年輕人才。
由於美國的出口限制,DeepSeek 一直在基於不太先進的 GPU 和晶片組開發模型。公司的目標是打造低成本模式,同時實現微薄的獲利。執行長梁志強致力於提升中國在全球人工智慧領域的地位,強調人工智慧發展需要原創而非模仿。 DeepSeek 的重點是開發創新 LLM 並圍繞應用程式建立生態系統。