業務で使うPython前処理

Pythonを活用したデータの正規化・クリーニング手法を実務視点で徹底解説するブログです。多様な業務データの統一・整形方法や自動化事例、具体的なコードサンプルを豊富に紹介します。

[Python]電話番号フォーマット自動整形術

1. はじめに 電話番号やFAX番号は、ユーザーの入力方法により括弧、スペース、ハイフンなどの記号が混在し、データベースやシステム連携で問題が発生することがあります。この記事では、Pythonを用いてこれらの混在した形式 […]

Pythonで学ぶURL正規化入門

1. はじめに Webサイト運営やデータ解析の現場では、URLに余計なトラッキングパラメータやクエリが付与されることが多く、これがSEOやアクセス解析に悪影響を及ぼす場合があります。この記事では、Pythonを用いて不要 […]

[Python]更新マニュアルの差分比較法

1. はじめに 業務マニュアルや社内文書の更新管理は、多くの企業で共通の課題です。手動での差分チェックは見落としやミスにつながる可能性があり、時間も労力もかかります。そこで、Pythonを利用して旧版と新版のテキストを自 […]

[Python]住所データの正規化(2/2)

1. はじめに この記事は下記の記事の続きです。 [Python]住所データの正規化(1/2) | 業務で使うPython前処理 1/2では、都道府県や市、番地を分離する方法を紹介しました。この記事では簡単なマスタを使っ […]

[Python]住所データの正規化(1/2)

1. はじめに 住所データは、企業の顧客管理システムや配送システムなど、さまざまなシステムで利用されます。しかし、入力データの形式がバラバラだと、データがうまく突合されなかったり、システムの不具合、障害の原因になることが […]

[Python]契約書などの文書中からIDを抽出

1. はじめに Pythonの正規表現を活用し、契約書や報告書、請求書などの長文から「Invoice No: XXXXX」や「Order ID: YYYYY」といった特定パターンの文字列を自動抽出する方法について解説しま […]

[Python]クレーム文から連絡先抽出術

1. 導入 クレーム文に記載された電話番号やメールアドレスを手作業で行うとミスが発生しやすく、業務効率の低下や顧客対応の遅延といったリスクを伴います。そこで、本記事ではPythonを用いて、クレーム文中の連絡先(電話番号 […]