peketaminの日記

その辺のプログラマーのチラ裏です。

Python 文字化け 特定

得られたテキストがバイト列だとして

content.decode('utf8', 'replace').replace('\ufffd', '__INVALID_CHAR__')

して、 __INVALID_CHAR__ で検索。 (replaceしないで、 � で検索してもいいっちゃいいけど)