di-gramがあれば、頻度分析は完璧か？

ハフマン符号化は頻度分析に従って可変長の符号を割り当てる表と、符号化で表現される（だったかな）が、
単純な文字単位の符号化では「同じフレーズの頻出」がわからない。
たとえばabcdef...zが繰り返して出てくる場合も、それぞれ同じ符号長を割り当てることしかできない。
任意のフレーズの頻出は、２文字の連続パターンの頻度分析でわかるか？という話。
わかるんだっけか、、、＞検索してみよう。

CiNii Articles - Data Compression Algorithm Based on Unification of the Most Frequent Digram

プログラミングErlangではtrigramが英単語の判定に使われる例が紹介されている(p.227)が、３文字組であるかどうかが本質的に重要なんだろうか。