misc.log

日常茶飯事とお仕事と

2バイト文字の塊を文字列から検出

訳あって2バイト文字が連続する箇所を文字列から検出する必要が出てきた。正規表現かなぁ?と思ったのだが、正直、苦手。処理ロジックを作る際のメモを書いておく。

一般的な英数字記号「以外」を検出する
[^a-zA-Z 0-9!-@\[-`{-~]+