姫野 公佐

姫野 公佐
三菱UFJ信託銀行
投資顧問業務部
ラップ運用G

2017年東京理科大学経営学部卒業。
同年4月に三菱UFJアセットマネジメント入社。
IT推進部、商品マーケティング企画部を経て
2023年7月より三菱UFJ信託銀行へ出向し、現職。
2024年3月東京都立大学大学院経営学研究科博士前期課程修了。
修士(ファイナンス)。

Ⅰ.はじめに

将来の相場を予測する際に、現在のチャート形状と似ている過去の局面を参考情報にすることがある。株式市場の場合には、株価チャートの形状が類似していることで、必ずしも将来にわたって同じ経過を辿るとは限らないものの、株価チャートには各時点のファンダメンタルズや金融政策、政治動向、それらに対する市場参加者の投資家心理や実際の投資行動まで数多くの情報が反映された結果である。そのため、投資判断の参考情報には十分なり得ると考えられる。実際、テクニカル分析と呼ばれる株価予測の技法の一部には、特定の株価チャートが繰り返し発生する傾向を前提として手法が体系化されている例もあり、将来の相場を予測する際に現在のチャート形状と似ている過去の局面を探索する意義があると考えられる。

そのような2つのデータ同士の類似度を定量的に測る指標として多く用いられるものの一つに相関係数がある。しかしながら、データ期間が異なると計算ができない点や、人間の視覚的な直観と指標が一致しない場合(※1)があるなど、課題もある。
そうした課題を解決する手法として、主に音声解析分野で用いられてきたDynamic Time Warping(DTW距離)を金融時系列データに用いて分析を行う研究(※2)がなされている。本稿では、主に金融時系列データに対してDTW距離を用いた先行研究を紹介した上で、実際のDTW距離の算出方法や相関係数等との指標値の比較を行う。その上で、実際の金融市場のデータを用いた類似チャートパターンの探索を行う。最後に結論と今後の課題を述べる。

※1 例えば、ある特定の期間に2つの株価チャートが『上昇の後下落』というパターンは同一で人間の視覚的に類似度の高いチャート形状であっても、上昇と下落の開始時点が異なる場合には必ずしも高い相関係数とはならず、指標が示す結果と人間の感覚が異なる場合が想定される。

※2 先行研究の詳細はⅡ先行研究に記載した。

Ⅱ. 先行研究

DTW距離は、主に音声解析の分野で開発されたとされている。人間の言葉を音声波形として捉えた場合、同じ言葉であっても話し手や会話の場面等によって話す速度(波長)や声の大きさ(振幅)が異なることもある為、音声波形の波長や振幅に違いが生じる。そこで、波形そのものは同一であっても、波長や振幅が異なる音声データに対して柔軟に比較できる尺度(※3)としてDTW距離が開発され、活用されるようになった。[1](参考文献、以下同様)

その後、金融時系列データ同士の類似度の比較にDTW距離が適用されるようになった。[4]は、ある銘柄の株価の動きに連動する、いわゆる関連銘柄の発見方法としてDTW距離を用いる手法を提案した。また、株価予測に用いる研究として、[2]は日次の株価リターンを「月初=1」として指数化してDTW距離を算出するIndexation DTW (IDTW)距離を提案した。DTW距離が「形状の一致」に注目した比較方法であるのに対し、IDTW距離は「形状」に加えて「位置の一致」にも注目する方法である。例えば、同一の指数同士の比較であっても、時点が異なると指数そのものの水準が異なる為、形状は同一であっても距離そのものが大きくなることがある。この様なケースに対応するため、月初=1として指数化されたIDTW距離では、時間のズレによる水準の差も考慮して距離を算出する手法である。また[5]では、分析対象となる月の日次株価変動とIDTW距離の近い過去の月(※4)を抽出し、その翌月の月次リターンがプラスなら買い、マイナスなら売りとした場合の収益率を計算し、東証株価指数(TOPIX)のリターンを上回ることを報告した。

[6]は更に、分割最適化クラスタリングの手法であるk – medoids法にDTW距離・IDTW距離を用いて、過去の株価指数に関する月別の日次データを任意の数でクラスタリングを実施。対象となる月が属するクラスターにおいて、翌月のリターンで上昇が多い場合は買い、下落が多い場合は売りとした場合のバックテストを実施。この場合の収益率を計算したところ、東証株価指数(TOPIX)のリターンを上回ることを報告した。その他にも、国内株式市場以外の市場を対象とした分析もなされている。[3]は、4か国の株式市場と3通貨の為替市場(※5)、仮想通貨市場に対してIDTW距離を用いた実証分析を行い、異なる市場価格の予測に有効であることを示した。

以上のように、DTW距離などの分析手法は、過去の類似したチャート形状を探索することに留まらず、株価予測に対しても一定の効果が実証されており、運用者にとってその有用性だけでなく、パフォーマンス向上に資する有効性も十分に期待されるものである。

※3 例えば、「2本のゴムひも(時系列データ)を伸び縮み(時間軸の調整)させて、どの程度まで形状を似せることができるか(最小の距離でマッチング)で類似性を評価する」とも考えられる。音声解析以外の分野での活用例として、「歩き方の分析(速く歩いても遅く歩いても、同じ人かどうかを見分ける)」、「心拍や脳波の比較(体調の変化を見つけるために、過去のデータと比較)」等がある。

※4 論文では、分析対象となる月と過去のIDTW距離の近い月を順に1,3,6,12,18,24,30,36ヵ月間抽出し、翌月の月次リターンの平均値を求めて分析を行っている。その結果、株価の上昇または下落が一致する正答率は3ヵ月が最も高く、正答率は64.17%となったことが示されている。

※5 4か国の株式市場は米国株式(S&P500)、フランス株式(CAC40指数)、ドイツ株式(DAX)、イギリス株式(FTSE100)。3通貨の為替市場はドル円(USDJPY)、ユーロ円(EURJPY)、ポンド円(GBPJPY)。

Ⅲ. DTW距離の算出とその特徴

1. DTW距離の算出例

以下で、DTW距離、IDTW距離の特徴を示し、株価分析の具体的事例を紹介する。
まず、以下2つの系列データを用いて、相関係数とDTW距離の指標の違いを示す。具体例として、系列データ 𝑝={𝑝[0],𝑝[1],…,𝑝[𝑖],…,𝑝[10]},𝑞={𝑞[0],𝑞[1],…,𝑞[𝑖],…,𝑞[10]} を用いて、相関係数と DTW 距離に基づく類似度を算出する。系列データ𝑝,𝑞 の要素を①のように定義する。

𝑝={5,10,15,20,10,0,−10,−15,−5,5,15}
𝑞={−5,0,5,10,15,20,10,0,−10,−15,−5} 

この2つの系列データは、図表1のように位相は異なるものの波形は同一である。

図表1:系列𝑝,𝑞の推移グラフ

図表1:系列𝑝,𝑞の推移グラフ

まず、系列データ𝑝,𝑞 の相関係数𝜌は、以下の②式で算出される。

その結果、相関係数は0.072となる。相関係数が1に近いほど正の相関、-1に近いほど負の相関、0に近いほど無相関と一般的にいわれているため、0.072という値は系列データ𝑝,𝑞が概ね無相関であることを示している。併せて以下の③式で定義される系列データ𝑝,𝑞の絶対値距離を算出する。

結果は145となる。

次に、DTW距離の算出を行う。DTW距離は、2つの実数𝑝[𝑖]𝑞[𝑗]の距離(※6)を𝑑(𝑝[𝑖],𝑞[𝑗])とする時、以下④式で算出される累積距離𝛾(𝑖,𝑗)を利用して作成する累積距離マトリクスを用いて計算できることが知られている。

※6 距離関数は非負であればよく、通常ユークリッド距離やマンハッタン距離等が用いられる。

図表2では、まずマトリクスの縦軸左下から左上に𝑝系列のデータを、横軸左下から右下へ 𝑞系列のデータを並べている。次に、各マスには、④式で算出される(𝑝[𝑖],𝑞[𝑗])の「累積距離𝛾(𝑖,𝑗)」を表示している。

次に、表左下マスにある両系列の始点(𝑖=0,𝑗=0)での累積距離𝛾(0,0)は、④式に𝑖=0,𝑗=0における各要素をあてはめ算出。具体的には、𝑝[0]=5、𝑞[0]=−5でありその距離𝑑(𝑝[0],𝑞[0])は5−(−5)=10。④式右辺第2項は該当する値がない(𝑛𝑢𝑙𝑙)であるので𝛾(0,0)は10となる(⑤式)。

𝛾(0,0) =𝑑(𝑝[0],𝑞[0])+𝑚𝑖𝑛[𝛾(𝑝[−1],𝑞[0]),𝛾(𝑝[0],𝑞[−1]),𝛾(𝑝[−1],𝑞[−1])]
    =10+𝑚𝑖𝑛[𝑛𝑢𝑙𝑙,𝑛𝑢𝑙𝑙,𝑛𝑢𝑙𝑙]
    =10

次に𝑝系列のみ時間を1つ進め、𝑝[1]=10、𝑞[0]=−5であり、距離𝑑(𝑝[1],𝑞[0])は10−(−5)=15となり、累積距離𝛾(𝑝[1],𝑞[0])は式④に当てはめ15+10=25となる(⑥式)。

𝛾(1,0)=𝑑(𝑝[1],𝑞[0])+𝑚𝑖𝑛[𝛾(𝑝[0],𝑞[0]),𝛾(𝑝[1],𝑞[−1]),𝛾(𝑝[0],𝑞[−1])]
=15+𝑚𝑖𝑛[10,𝑛𝑢𝑙𝑙,𝑛𝑢𝑙𝑙]
=25

同様に、各時点の𝑝(𝑖)と𝑞(𝑗) を組み合わせた全ての累積距離を計算して表を作成している。

この時、時間の変化は縦軸で上(𝑝の時間を進める)、横軸で右(𝑞の時間を進める)、斜め右上(𝑝,𝑞両方進める)のみを許容し、累積距離は、マトリクス始点(𝑝(0),𝑞(0))から、各時点(𝑝(𝑖), 𝑞(𝑗))までの合計距離が最小となるルートで計算されることとなる。その結果として作成されたのが図表2のマトリクスである。始点から終点までを最短ルート(赤線で表示)でつないだ合計距離をDTW 距離と定義しており、この距離が小さい場合は「似ている」、大きい場合は「似ていない」と評価される。

今回のケースでは、右上のマスにおける累積距離𝛾(10,10)である45がDTW距離となる。

図表2:系列𝑝, 𝑞のDTW距離算出の為の累積距離マトリクス

この値は前頁で算出した絶対値距離の145よりも小さく、同一の波形である系列データ𝑝, 𝑞の特徴をより捉えていると考えられる。

このように、波形の類似性を捉えたい場合には、DTW距離は相関係数や絶対値距離と比較すると優れた距離尺度である可能性がある。また、例示した系列データ𝑝, 𝑞 は同一の長さのデータとしたものの、DTW 距離は長さが異なるデータでも算出が可能であり、そのような点も相関係数や絶対値距離と比較した特徴であると考えられる。

2.絶対値距離とIDTW距離との比較

前項では、サンプルデータを用いて、絶対値距離とDTW距離を比較し、より波形の変動パターンを捉えることができる可能性について述べてきた。ここでは、実際の金融市場のデータを用いて、絶対値距離とIDTW距離との指標の比較を行い、その特徴を述べていく。

図表3は、TOPIX とS&P500指数の日次リターンに対する期初を1とした125日間の絶対値距離を横軸、同指数同士の125日間のIDTW 距離を縦軸として、データ期間を期初から期末まで1日ずつスライドした結果をプロットした散布図である。データ期間は2005年8月30日から2025年8月29日までの4,730日間とした。もし、2つの指数から算出される絶対値距離とIDTW距離のそれぞれの距離尺度が似た傾向を示すのであれば、横軸の絶対値距離が小さい時に縦軸のIDTW距離も小さく(類似度が高く)なる。反対に横軸の絶対値距離が大きい時に縦軸のIDTW距離も大きく(類似度が低く)なる為、右肩上がりの対角線上に点が集まるはずである。また、対角線上以外の領域、中でも絶対値距離よりもIDTW距離が小さくなる、対角線を境に右下の領域に点がプロットされる場合には、絶対値距離と比較してIDTW距離が金融市場のデータの波形をより捉えている可能性がある。

結果を見ると、全体的に右肩上がりの対角線上に点がプロットされたものの、対角線を境に右下の領域にもプロットされた点が多数みられる。これは、横軸の絶対値距離よりも縦軸のIDTW距離が小さいことを示しており、絶対値距離が捉えきれない金融市場のデータの波形をIDTW距離が捉えている可能性がある。図表3左下の領域の中で、絶対値距離をIDTW距離で除した値が最も低いプロット、すなわち絶対値距離と比較してIDTW距離を用いた方が最も効果的と思われるケースを点P(絶対値距離=8.0736、IDTW=1.5901)とし、図表4にその対象期間125日分の東証株価指数とS&P500指数の推移グラフを掲載した。各指数は期初を1として指数化している。その結果、対象期間における東証株価指数とS&P500の指数は、35~55日目辺りでの上昇・下落の違いにより水準が異なるものの、期間全体として価格変動の形状は概ね一致している印象を受ける。一例ではあるが、DTW距離(IDTW距離)は絶対値距離と比較し、価格変動パターンの特徴を捉えられている可能性が高く、株価予想を行う上での実用性が期待できる手法と考える。

図表3:東証株価指数とS&P500の絶対値距離とIDTW距離
(125日ローリング日次リターンベース)

図表4:点P(図表3)における東証株価指数とS&P500の指数推移

点P(図表3)における東証株価指数とS&P500の指数推移)

3.東証株価指数の過去の類似チャートパターンの探索

前項では、東証株価指数とS&P500の2つの指数を用いて、相関係数とDTW距離(IDTW距離)の特徴について述べてきた。ここでは、IDTW距離を用いて、同一指数内における過去の類似局面の探索を行う。具体的には、2005年8月1日から2025年8月29日までの東証株価指数の日次リターンデータについて、月初を1として月別に指数化し、241カ月間の月毎のIDTW距離を算出する。図表5には、算出例としてデータ期初3カ月(2005年8月から2005年10月)とデータ期末3ヵ月間(2025年6月から2025年8月)の計算結果を示した。
図表6には、前述の計算にてIDTW距離が0.0484と最も小さかった組み合わせである2017年7月と2023年2月を含む5カ月間の株価チャートを表示した。類似度が最も高かった期間は、図表上に太字矢印にて記した。
その結果、太字矢印で記された上段と下段の類似度が高い月同士の株価チャートの波形の類似性はもとより、その後約3カ月間にわたるチャート推移においても、小幅な下落後に上昇トレンドとなる波形も似たものとなっている。この期間の各月同士のIDTW距離が小さい(類似度が高い)月同士のその後3カ月間となる2017年8月と2023年3月、2017年9月と2023年4月、2017年10月と2023年5月は、IDTW距離がそれぞれ0.2081、0.1234、0.0935と小さく、類似度が高い傾向が継続(※7)している。このケース以外でも同様の傾向が複数確認されており、DTW距離は過去の類似局面の探索のみならず、先行研究で示された株価予測についても一定の効果がある可能性を確認した。

※7 [5]では、IDTWに基づく戦略とモメンタム戦略との比較がなされている。両戦略の累積収益率の相関係数は0.15であり、IDTW戦略の方がモメンタム戦略よりもパフォーマンスが上回ることを報告している

図表5:東証株価指数の月次IDTW 距離算出の例

東証株価指数の月次IDTW 距離算出の例

図表6:類似度が高い月同士の東証株価指数のチャート
(2017年7月と2023年2月)

類似度が高い月同士の東証株価指数のチャート
(2017年7月と2023年2月)

Ⅳ.終わりに

本稿では、DTW距離の具体的な算出方法や、相関係数や絶対値距離との比較を通じた特徴について述べてきた。また、東証株価指数データを用いて、同一指数内における過去の類似チャートパターンの探索も行った。

実際の金融市場のデータを用いた分析では、IDTW距離が絶対値距離よりも小さい値をとる事例が確認され、そのような事例では、IDTW距離が人間の視覚的な類似性を捉えている可能性について言及した。また、月次ベースでの過去の類似チャートパターンの探索では、類似度の高い局面の発見のみならず、翌月以降も類似度の高い局面が継続する可能性も示唆され、先行研究でも述べられた株価予測についても一定の効果がある可能性を確認した。

尚、本稿では類似チャートパターンの探索は主に月次ベースで行ったものの、期間は任意に設定が可能である。一方で、全てのパターンの探索には甚大な計算が必要となる為、期間の設定プロセスの明確化や実運用に資する運用戦略への適用について、今後検討を行って参りたい。

(2025年10月16日 記)

※本稿中で述べた意見、考察等は、筆者の個人的な見解であり、筆者が所属する組織の公式見解ではない

【参考文献】

[1]Sakoe, Hiroaki, and Seibi Chiba. “Dynamic programming algorithm optimization for spoken word recognition.” IEEE transactions on acoustics, speech, and signal processing 26.1 (2003): 43-49.

[2]今村光良, 中川慧, and 吉田健一. “資産価格変動パターンの類似性に着目した金融市場予測の評価.” 人工知能学会全国大会論文集 第 31 回 (2017). 一般社団法人 人工知能学会, 2017.

[3]今村光良, 中川慧, and 吉田健一. “価格変動パターンによる証券/為替/仮想通貨市場の分析.” 電気学会論文誌 C (電子・情報・システム部門誌) 138.8 (2018): 992-998.

[4]小沢育実. “関連銘柄同定のための時系列データ類似度尺度の提案.” 情報処理学会第 78 回全国大会講演論文集 2016.1 (2016): 301-302.

[5]中川慧, 今村光良, and 吉田健一. “株価変動パターンの類似性を用いた株価予測.” 人工知能学会全国大会論文集 第 31 回 (2017). 一般社団法人 人工知能学会, 2017.

[6]中川慧, 今村光良, and 吉田健一. “価格変動パターンを用いた市場予測 k-Medoids Clustering with Indexing Dynamic Time Warping の株式市場への適用.” 電気学会論文誌 C (電子・情報・システム部門誌) 138.8 (2018): 986-991.

本記事は三菱UFJ信託銀行が公開する「資産運用情報」の転載記事です。

ご注意:
・本資料は、お客さまに対する情報提供のみを目的としたものであり、三菱UFJ信託銀行が特定の有価証券・取引や運用商品を推奨するものではありません。
・ここに記載されているデータ、意見等は三菱UFJ信託銀行が公に入手可能な情報に基づき作成したものですが、その正確性、完全性、情報や意見の妥当性を保証するものではなく、また、当該データ、意見等を使用した結果についてもなんら保証するものではありません。
・本資料に記載している見解等は本資料作成時における判断であり、経済環境の変化や相場変動、制度や税制等の変更によって予告なしに内容が変更されることがありますので、予めご了承ください。
・三菱UFJ信託銀行はいかなる場合においても、本資料を提供した投資家ならびに直接間接を問わず本資料を当該投資家から受け取った第三者に対し、あらゆる直接的、特別な、または間接的な損害等について、賠償責任を負うものではなく、投資家の三菱UFJ信託銀行に対する損害賠償請求権は明示的に放棄されていることを前提とします。
・本資料の著作権は三菱UFJ信託銀行に属し、その目的を問わず無断で引用または複製することを禁じます。但し、第三者に著作権が属し三菱UFJ信託銀行が使用許諾を得て掲載している内容が含まれる場合があり、その部分の著作権は当該所有者に属します。
・本資料で紹介・引用している金融商品等につき三菱UFJ信託銀行にてご投資いただく際には、各商品等に所定の手数料や諸経費等をご負担いただく場合があります。また、各商品等には相場変動等による損失を生じる恐れや解約に制限がある場合があります。なお、商品毎に手数料等およびリスクは異なりますので、当該商品の契約締結前交付書面や目論見書またはお客さま向け資料をよくお読み下さい。