現在開発中のもの
Python用自動要約モジュール
Pythonで日本語&英語を自動要約するモジュールを開発中です。
精度はまだまだですが、開発成果はすこしずつ http://www.civory.com で公開していきます。
クラスタリングエンジン
クラスタリングエンジン。
高速に文書、プロフデータ、タグ付きデータなどなどを分類するためのクラスタリングエンジンを書き始めました。
メインの処理はC++で書きます。
現在の所、2000アイテム程度なら、10秒ほどで分類できます。
今後さらにこれを改善し、1秒程度で処理できることを目指します。(分散処理が必要そうなら、分散処理も書きます。)
今後これをPythonから使えるようにするべきか、Erlangから使えるようにするべきか、思案中。
上の自動要約での活用も考え中。
協力して頂ける方はお気軽にメール(ayukawa.hiroshi@(ジーメール))でもirc(ayu@#CodeRepos)でも声かけてください。
![(please configure the [header_logo] section in trac.ini)](/share/chrome/site/your_project_logo.png)