Transformer : 事前学習 : 入力テクストの長さ制限

入力テクストの長さ制限

作成: 2025-05-16
更新: 2025-05-20

1. 入力テクストの長さ制限

Transformer は「固定長の入力」仕様。
「入力できる長さ」の意味は，「一度に処理できるトークン数の上限」。
この上限を，「コンテクスト長 (context length)」とか「シーケンス長 (sequence length)」と謂う。

2. コンテクスト長を超えるテクストの場合

区切りの単位は，ランダム・シャッフルや windowing のような工夫を加えることもある。
基本は「自己完結的な範囲での処理」として扱われる。