ファイルの読み書きもできたし、16進を10進に変換できたし、いよいよMahout用データを作るプログラムを書こうと思ったら、カンマ区切りの入力データを分割する方法が未確認だということが発覚。調べて試してみる。
comma_split.py
# -*- coding: utf-8 -*- if __name__ == "__main__": comma_del_str = "aaa,bbb,ccc,ddd" list = comma_del_str.split(",") for column in list: print(column)
文字列型のオブジェクトに対してsplit(“区切り文字”)するだけだった。
$ python comma_split.py aaa bbb ccc ddd