PythonでCSVの整合性チェック
Python(v2.7)のcollectionsを使って,CSVの列数の整合性をチェックしています.というのも,Webサイトから取得した情報をCSVに変換しているのですが,そのプログラムが悪いせいか,列数の整合性が取れず,エラーが出たためです.
入力ファイルはUTF8でエンコードされていると想定しています.
from collections import Counter
idx=0 # Line Index
for line in open('hogehoge_UTF8.csv', 'r'):
itemList = unicode(line[:-1],"utf-8","strict")
cnt=Counter()
for word in itemList:
cnt[word] += 1
print str(idx)+"行目の列数:"+str( cnt[','])
idx+=1;
- 作者: 辻真吾
- 出版社/メーカー: 技術評論社
- 発売日: 2010/04/24
- メディア: 大型本
- 購入: 19人 クリック: 199回
- この商品を含むブログ (59件) を見る