得られたテキストがバイト列だとして
content.decode('utf8', 'replace').replace('\ufffd', '__INVALID_CHAR__')
して、 __INVALID_CHAR__
で検索。 (replaceしないで、 � で検索してもいいっちゃいいけど)
得られたテキストがバイト列だとして
content.decode('utf8', 'replace').replace('\ufffd', '__INVALID_CHAR__')
して、 __INVALID_CHAR__
で検索。 (replaceしないで、 � で検索してもいいっちゃいいけど)