1. 為何需要專門的金融K線 Foundation Model?
時間序列基礎模型(TSFM)在電力、醫療等領域已有成功案例,但金融 K線資料面臨獨特挑戰:
- K線具有多維結構(OHLCVA),難以直接套用一般 Transformer
- 市場具有高噪聲、非穩態特性,過去規律不一定適用未來
- 不同交易所的交易規則、結算制度、漲跌限制各異,跨市場泛化困難
Kronos(arXiv:2508.02739,AAAI 2026)針對這些問題提出系統性解決方案,是第一個開源的金融 K線基礎模型。
2. 技術架構:兩階段框架
Stage 1:K-line Tokenizer(BSQ)
使用 Binary Spherical Quantization 將連續多維的 OHLCVA 向量量化為離散 tokens。這個 tokenizer 並非一般 NLP 的 BPE,而是針對金融市場價格動態專門設計,能保留價格區間、相對變化等關鍵資訊。
Stage 2:Autoregressive Transformer
Decoder-only 架構,在量化後的 token 序列上做自回歸預測。預訓練目標為「預測下一個 K-line token」,與 GPT 系列語言模型的訓練邏輯一致。
3. 模型版本與選擇
| 模型 | Tokenizer | Context Length | 參數量 | 開源 |
|---|---|---|---|---|
| Kronos-mini | Kronos-Tokenizer-2k | 2048 | 4.1M | ✅ |
| Kronos-small | Kronos-Tokenizer-base | 512 | 24.7M | ✅ |
| Kronos-base | Kronos-Tokenizer-base | 512 | 102.3M | ✅ |
| Kronos-large | Kronos-Tokenizer-base | 512 | 499.2M | ❌ |
預訓練規模:120 億筆 K線記錄、45 個交易所、7 種時間粒度。
HuggingFace:NeoQuasar/Kronos-small
4. 台灣股市應用評估
優勢
- 預訓練涵蓋45個交易所、120億筆 K線,台灣屬亞洲新興市場,已有跨市場泛化能力
- Zero-shot RankIC 領先其他 TSFM 93%
- Kronos-mini(4.1M)可在一般 GPU 執行,適合個人或小型團隊研究
- 不需自行設計特徵工程或時間序列標記
限制
- Context Length 限制(512 ~ 2048),日K約1.4年至8年
- 不看財報、總經、籌碼等非價格資訊
- 台灣特有的政策干預、權值股主導特性未被訓練進去
- ±10% 漲跌限制、T+2 結算等台灣制度細節,建議透過 Fine-tuning 針對優化
5. 建議流程
- 回測優先:以歷史日K做滾動窗口回測,觀察模型在多頭、空頭、震盪不同市場型態的表現
- 參考輔助:Kronos 預測結果作為技術面輔助參考,不作唯一進出场依據
- 長期評估 Fine-tuning:如欲針對台股特性微調,需較大 GPU 資源與乾淨歷史資料
參考連結
| Kronos GitHub | github.com/shiyu-coder/Kronos |
| Kronos 論文 | arxiv.org/abs/2508.02739 |
| HuggingFace 模型 | NeoQuasar/Kronos-small |
| twstock 套件 | github.com/mlouielu/twstock |
研究時間:2026-04-12
沒有留言:
張貼留言