FXロジック大全:タートルズから強化学習まで¶

Tip
- FXのトレードロジックは「予測型」「裁定型」「レジーム認識型」「情報優位型」の4象限に整理でき、個人トレーダーには明確なルールを持つトレンドフォローやミーンリバージョンが最も現実的です。
- タートルズのドンチャンブレイクに代表されるトレンドフォローは「小さく負けて大きく勝つ」損益の非対称性を追求し、マーチンゲール(ナンピン)とは真逆の哲学に立っています。
- AI・強化学習は強力な可能性を持つ一方で過学習と市場の非定常性という本質的な課題があり、自分の資金・時間軸・情報優位に合ったロジックを選ぶことが重要です。
「ナンピンで助かった」という経験が、やがてトレーダーを破滅させます。これは統計的な必然であり、数学的に証明できる事実です。
問題は、マーチンゲール(ナンピン)が「悪い戦略だ」と知りながらも使い続けてしまうことにあります。代わりに何を使えばいいか、具体的な選択肢を知らないからです。
本記事は、FXのトレードロジックを歴史的文脈とともに横断する「百科事典」です。1980年代の古典から最先端のAIアプローチまで、各ロジックが「なぜ生まれ、どのように機能し、あるいは機能しなくなったか」を、具体的な提唱者や事例を交えて紐解きます。最終的には、あなた自身が「自分の資金・時間軸・情報優位」に合ったロジックを選び取るための地図を提供します。
序章: なぜマーチンゲール以外のロジックを知るべきか¶
マーチンゲール戦略は、負けたら次回の賭け金を倍増して取り戻すという単純なロジックです。FXでは「ナンピン買い」として知られます。一時的な利益は生み出せても、資金が有限である以上、連敗が続けば確実に破綻します。これは数学的に明らかです。
この危険な戦略に依存してしまう背景には、「小さく負けて大きく勝つ」という損益の非対称性を実現する他の方法を知らないことがあります。
本記事で紹介する多くのロジック、特にトレンドフォローは、この非対称性を「損切りは小さく、利益は伸ばす」という形で追求します。マーチンゲールとは真逆の哲学です。まずは視野を広げ、選択肢の存在そのものを知ることから始めましょう。
第一章: 古典的ロジック群 ― 市場の基本的な振る舞いを捉える¶
市場の価格変動には、主に二つの基本的な様相があります。「トレンド(傾向)」と「レンジ(もみ合い)」です。古典的ロジックは、この二つへのアプローチとして発展しました。
トレンドフォロー ― 「相場の趨勢に乗る」哲学¶
トレンドフォローは、相場に明確な方向性が生じた時にその流れへ追随して利益を得るアプローチです。その核心は「小さく負けて大きく勝る」損益の非対称性にあります。
タートルズ戦略(ドンチャンブレイク)
1980年代、伝説的商品トレーダーであるリチャード・デニスは、「優れたトレーダーは生まれつきか、それとも育てられるか」を確かめるため、一般人を集めてトレードを教える実験を行いました。これが「タートルズ」です。
彼らに教えられたシンプルなルールの一つが、ドンチャンブレイク(チャネルブレイクアウト)です。過去N日間の高値・安値を更新したらエントリーし、不利な方向に一定幅動いたら損切りします。数学的には単純な比較ですが、トレンドの発生を機械的に捉え、損切りを徹底することで「大きな一勝」を狙う構造を持っています。
CTAと時系列モメンタム
AHL(現Man Groupの一部) に代表されるCTA(コモディティ・トレーディング・アドバイザー)は、このトレンドフォローをシステマティックに大規模運用した先駆者です。彼らが依拠する「時系列モメンタム」とは、「過去のリターンが将来も持続する傾向がある」という経験則です。市場参加者の心理——追い買いや損切りの遅れ——に起因すると考えられています。
ミーン・リバージョン ― 「行き過ぎた振り子は戻る」という信仰¶
価格は一定の範囲を行き来するという前提に立つのがミーン・リバージョン(平均回帰)です。統計学に基づく逆張りの思想です。
ボリンジャーバンドは、1980年代にジョン・ボリンジャーが開発した指標で、移動平均線とその上下に引かれた標準偏差(σ)バンドで構成されます。価格が±2σバンドを超えることは確率的に稀であるため、その領域まで来れば平均値に戻る確率が高いと見なします。
RSI逆張りは、J.W.ワイルダーが提唱した相対力指数(RSI)を用います。一定期間の値動きの強弱を0〜100で示し、経験則的に70以上を「買われすぎ」、30以下を「売られすぎ」の領域として反転を予想します。
第二章: 構造を突くロジック ― 市場の非効率性を統計的に狩る¶
市場が完全に効率的であれば、こうした戦略は成立しません。しかし現実には、一時的な価格の歪みや、通貨間の関係が崩れる瞬間が存在します。これを数学的に捉えようとするのが「裁定」のロジックです。
ブレイクアウトは、レンジ(支持線・抵抗線)の突破をシステマティックに捉える戦略です。レンジ相場からトレンド相場への転換点を狙うアプローチで、第一章のドンチャンブレイクもその一形態です。
ペアトレードと共和分は、非常に相関の高い2つの資産(例:EUR/USDとGBP/USD)の価格差に注目します。通常は一定の範囲で推移するこの価格差が拡大した場合、「割高な方を売り、割安な方を買う」ポジションを組み、価格差が収束するのを待ちます。この「長期的な均衡関係」を統計的に検定する概念が共和分(Cointegration)です。裁定機会を定量的に評価するための重要なツールとなっています。
統計的裁定は、ペアトレードをさらに発展させた手法です。多変量の統計モデル(線形回帰、主成分分析など)を用いて、多数の通貨ペア間の複雑な関係から「理論価格」を算出し、市場価格との乖離を取引します。ルネサンス・テクノロジーズのジェームズ・シモンズに代表されるクォンツファンドが用いる核心的な手法の一つです。
第三章: 現代確率論的アプローチ ― 不確実性をモデル化する¶
市場は「トレンド」か「レンジ」かだけでなく、もっと複雑な「状態」を取りうると考え、その隠れた状態を確率的に推定しようとするアプローチです。
カルマンフィルターは、1960年代にルドルフ・カルマンが発表したアルゴリズムです。ノイズに満ちた観測データ(価格)から、背後にある「真の状態」——トレンドの傾きやボラティリティなど——を逐次的に推定します。FXでは、為替ペア間の動的な相関係数や最適ヘッジ比率をリアルタイムで計算する用途への応用が研究されています。
HMM(隠れマルコフモデル)は、市場に目に見えない「レジーム」が存在すると仮定します。強トレンド相場、弱トレンド相場、高ボラティリティ・レンジ相場——これらが確率的に遷移すると考え、観測できる価格変動から現在の「隠れたレジーム」を推定します。「今はトレンドフォローが有効な状態か、ミーンリバージョンが有効な状態か」を確率的に判定する応用が考えられます。
ファクター投資のFX応用は、株式市場でケネス・フレンチらが体系化した「ファクター投資」の考え方をFXに導入する試みです。FXにおける主要ファクターとして、以下の3つが研究されています。
- キャリー: 金利差。高金利通貨を買い、低金利通貨を売ります。
- バリュー: 購買力平価(PPP)などから計算された「割安・割高」度。
- モメンタム: 過去のリターン(時系列モメンタム)。
第四章: AIと強化学習 ― 試行錯誤で最適行動を学習させる¶
ここまでのロジックは、人間が定義したルールやモデルに基づいていました。強化学習は、エージェント(取引プログラム)自身が環境(市場)と相互作用し、報酬(利益)を最大化する行動を試行錯誤を通じて学習させる枠組みです。
Q学習は、ある「状態」(例:価格、ボラティリティ、ポジション)において取りうる「行動」(買い、売り、保有)の長期的な価値(Q値)を学習します。PPO(Proximal Policy Optimization) は、より安定した学習を実現するために開発された現代的なアルゴリズムです。ポジションサイジングの最適化や、複雑な取引ルールの自動生成への応用が研究されています。
しかし、強力な可能性の裏側には、FXならではの巨大な壁があります。
最大の課題は 「過学習」と「市場の非定常性」 です。過去のデータに完璧に適合しすぎたモデルは、変化した未来の市場では無力になりがちです。また、学習に必要な膨大で高品質なデータの準備、計算リソース、アルゴリズム実装の専門性は、個人トレーダーが現実的に扱えるラインを超えている場合が多いです。
この領域は「可能性を知る」ことと「実装の現実」を分けて考えることが重要です。
第五章: 人間の知と速度の極限 ― 情報優位の二つの形¶
システマティックなアプローチとは対極に、独自の情報・分析、あるいは圧倒的な速度に基づくロジックがあります。
グローバルマクロ ― ソロスの「反射性」
1992年のポンド危機(英国ERM離脱)において、ジョージ・ソロス率いるクォンタムファンドが巨額の利益を挙げたことは広く知られています。これは典型的なグローバルマクロ戦略です。当時の英国が抱えていた高金利と経済疲弊という根本的な不均衡を見極め、為替・金利・株式市場を横断した大規模なポジションを構築しました。
ソロスの哲学「市場は常に間違っている」と「反射性」——市場参加者の認識が現実そのものを歪めるフィードバック——は、アルゴリズムでは捉えにくい人間の認知バイアスに基づくロジックです。
HFT(高頻度取引) ― 速度そのものが情報優位
ミリ秒・マイクロ秒単位で膨大な注文を執行し、ごく微小な価格差や注文執行の速さそのものを利益源とします。高度な技術インフラ(サーバーコロケーション、超低遅延ネットワーク)とアルゴリズムが必要であり、個人トレーダーが参入することは事実上不可能な領域です。2010年の米国株式市場「フラッシュクラッシュ」は、HFTアルゴリズムの相互作用が引き起こすリスクの一端を示しました。
考察: ロジックの系譜マップと、個人トレーダーが現実的に採用可能な領域¶
これまで紹介してきた多様なロジックを整理すると、以下の4つの象限に分類できます。
| 象限 | 特徴 | 代表例 | 個人トレーダー向け現実度 |
|---|---|---|---|
| 予測型 | 価格の方向性を予測 | トレンドフォロー、ミーンリバージョン | 高い。ルールが明確で、バックテスト可能。 |
| 裁定型 | 価格の歪み・関係性を利用 | ペアトレード、統計的裁定 | 中〜低。ペアトレードは可能だが、統計的裁定は高度な数学的知識が必要。 |
| レジーム認識型 | 市場の状態を確率的に推定 | HMM、カルマンフィルター | 中。概念理解は有益だが、実装と最適化には専門性が要求される。 |
| 情報優位型 | 独自情報・分析・速度 | グローバルマクロ、HFT | 極めて低い。HFTは不可能。グローバルマクロは深い経済理解が必要。 |
個人トレーダーが現実的に取り組みやすいのは、圧倒的に 「予測型」、特に古典的でルールが明確なトレンドフォローやミーンリバージョン です。その上で 「レジーム認識型」の考え方(今はどちらの戦略が向いているか)を取り入れることで、適応性を高められるでしょう。
「裁定型」は学習コストが高く、「情報優位型」は個人のリソースでは再現困難です。AI・強化学習は強力なツールですが、「過学習との戦い」という本質的な課題を理解した上で、可能な範囲でツールとして利用する視点が現実的です。
まとめ: 「自分の資金・時間軸・情報優位」に合うロジックを選ぶための指針¶
FXロジックの大海原を航海するための羅針盤は、あなた自身の中にあります。
自分の資金を見る。 少額資金で「小さく負けて大きく勝つ」トレンドフォローは心理的ハードルが高いかもしれません。まずはシミュレーションで体感を積んでください。
自分の時間軸を見る。 デイトレードとスイングトレードでは有効なロジックが異なります。5分足のノイズにミーンリバージョンを適用しても機能しにくいでしょう。
自分の情報優位を見る。 経済指標を深く分析する時間も情熱もないなら、グローバルマクロは不向きです。一方、プログラミングが得意なら、シンプルなルールの自動化から始めることが優位性になります。
本記事は、数多あるロジックの「入口」に過ぎません。タートルズの詳細なルール、共和分検定の実際の手法、カルマンフィルターの具体的な応用例——それぞれの深淵は、個別の記事で掘り下げていく価値があります。
まずは、マーチンゲールという危険な孤島から脱出し、トレードロジックという豊かな大陸の存在を知ること。そして、自分に合った土地を探す旅を始めてみてください。そこには、単なるギャンブルを超えた、知的で戦略的な世界が広がっています。