打鍵ダイナミクスに基づく集中力リアルタイム推定アルゴリズムの設計思想（第一部）

注意： 本記事は、Gamita Novelist 開発チームによるホワイトペーパー「打鍵ダイナミクスに基づく集中力リアルタイム推定アルゴリズム」の内容を分割して紹介する第一部です。アルゴリズムの概要および論文PDFのダウンロードにつきましては、以下の紹介記事をご覧ください：打鍵パターンから集中度をリアルタイム推定するアルゴリズム：ホワイトペーパー公開
本稿および記載されているアルゴリズムは、クリエイティブ・コモンズ表示 - 非営利 4.0 国際 (CC BY-NC 4.0) ライセンスの下で提供されています。商用利用を希望される場合は、お問い合わせよりご連絡ください。

概要

本アルゴリズムは、打鍵パターンのみから執筆者の集中強度を連続値スコア F_t ∈ [0, 100] として推定するリアルタイムエンジンである。

本稿は、Gamita Novelistで研究している打鍵ダイナミクスによる認知状態推定の初期研究成果を公開するものである。本稿の公開の目的は、Gamita Novelistが創作活動支援と向き合っている過程を、利用ユーザーに少しでも知ってもらうためである。正式な学術論文や先行研究発表などとして発表するものではない。

ここで定式化されたアルゴリズムは、改良されたのちにGamita Novelistのテキストエディタに応用されている。現行の実装では本稿の手法を礎として独自のアクティビティ機能へと発展し、集中力のみならずストレス状態のリアルタイム推定にも対応している。

設計上の核となる原則は以下の通り。

絶対量ではなく個人内相対量を測定する。同じ打鍵速度でも、ある人にとってはフローであり、別の人にとっては低活動である。
沈黙 ≠ 非集中として扱う。小説家は文章を考える間、止まる。思考的休止を寛容に受け入れる時定数はユーザーごとに異なり、アルゴリズムが自動学習する。
固有値を排除する。アルゴリズム動作を左右する主要な時定数は実行時に統計量から自動算出する。開発者の直感による「感度調整」を不要にする。
長期記憶と短期応答の両立を図る。
堅牢性を絶対に保証する。NaN・Inf・負の分散は生成しない。

本論文がもたらす進歩性

既存のタイピング監視システム等は「5秒間入力がなければ非集中」といった固定値に依存しており、プロの長考や個人の生体的なリズムを誤判定する構造的な課題があった。また、そのような一律的な判定モデルに由来する過信・誤信により信頼性を損ねている現状がある。本研究のコアとなる貢献は以下の3点である。

生体リズムの動的写像：執筆者固有の「思考のための必要な休止」と「活動の連鎖」をリアルタイムで逐次学習し、これを単なる統計量ではなく、「信号処理フィルタの時定数（τ）へ自己適応的に写像する」という独自の制御モデルを新たに構築した。
長期忘却と再学習モデリング：怪我や加齢によるスランプといった長期的なライフスタイルの変化（恒久的なコンディションの低下）に対し、「過去のベースラインによる誤判定」を数理的に解放し、再適応を促すための忘却関数を定式化した。
統計的堅牢性の検証：固定値ベースラインとの比較において、本手法が特異な打鍵パターン（長考型や早筆型など）においても個人の正常なスコアを保ちつつ、微小な過集中や散漫を統計的に有意な水準（p < 0.001）で分離可能であることをシミュレーション上で示した。

シミュレーション設計の妥当性について

ペルソナ設計の根拠

打鍵速度レンジの上限は REALFORCE TYPING CHAMPIONSHIP 2025 出場選手の記録（約 1,000 kpm ≈ 16.7 keys/s）を参考に設定し、下限は一般的な PC 操作が正常に行える最低速度（約 3 keys/s）を基準とした。各ペルソナの速度パラメータはこのレンジ内に収まる設計となっている。

8 種類のスタイルは「多様性の網羅」ではなく、本アルゴリズムの設計原則それぞれに対するストレステストとして選定した。すなわち、P04・P08（長考型）は「沈黙 ≠ 非集中」原則、P05（早筆型）は τ_rise 上限クランプ機能、P01（気まぐれ型）はエイジング機能、P06（プロ規則型）は τ_fall の精度、P08（プロ長考型）はプロ打鍵密度と長考休止の共存という、それぞれが独立した設計上の課題を代表するケースとなっている。

本検証はキーストロークの先行研究を検証・比較するものではなく、ユーザーが実際に使うツール・手法との比較を目的としている。自己啓発やビジネス書などで紹介されている手法を検証の対象とした。これにより、一般的に有効とされているモチベーション維持や自己認知が役立つのかをランダム性が高いシミュレーションを行うことで検証する。

本アルゴリズムを応用した製品版には、学習データの一部に提供された実ユーザーのデータを使用して追加検証を行い、精度の向上を図っている。

比較対象の選定理由

比較対象（Binary、Linear、EMA、Persistence、Static Z、ポモドーロ各種）はすべて、実際のユーザーが代替手段として選択しうる現実的なツール・手法および統計学的な手法から選定した。

効果量の解釈

Cohen's d が高値（例：2 以上）を示すのは、シミュレーション上で「絶好調状態」と「散漫状態」の条件差が設計者によって制御されているためであり、これはシミュレーション固有の特性である。独立した実データによる検証では、効果量は一般に縮小する。本稿に記載の数値は、アルゴリズムの設計特性をシミュレーション条件下で評価した指標として解釈すべきものであり、実環境での絶対的な性能を保証するものではない。

ライセンス表記

本稿および本稿に記載のアルゴリズムは、クリエイティブ・コモンズ表示 - 非営利 4.0 国際（CC BY-NC 4.0）ライセンスの下に提供されている。

個別に商用利用を希望する場合は、お問い合わせよりご連絡ください。