di-gramがあれば、頻度分析は完璧か?

ハフマン符号化は頻度分析に従って可変長の符号を割り当てる表と、符号化で表現される(だったかな)が、
単純な文字単位の符号化では「同じフレーズの頻出」がわからない。
たとえばabcdef...zが繰り返して出てくる場合も、それぞれ同じ符号長を割り当てることしかできない。
任意のフレーズの頻出は、2文字の連続パターンの頻度分析でわかるか?という話。
わかるんだっけか、、、>検索してみよう。

プログラミングErlangではtrigramが英単語の判定に使われる例が紹介されている(p.227)が、3文字組であるかどうかが本質的に重要なんだろうか。