
UNIXでコマンドとシェルスクリプトの組み合わせによりシステム開発を行う「ユニケージ開発手法」。
その研究・普及に努めているユニバーサル・シェル・プログラミング研究所 代表取締役所長の當仲寛哲氏に「ユニケージ開発手法」で何が出来るのか、を今回お話をお伺いしました。
インソースと共催!1名から参加できるビッグデータ処理入門 ~UNIX/Linuxの基本機能でデータサイエンティストになれるユニケージ開発手法(半日)
大体どこの会社にも「エクセル名人」と言われる方がいて、僕もいろんな会社に行ってびっくりするんですけど、A3の紙に出したら虫眼鏡で見ないといけないような、ものすごいエクセルの表やグラフがたくさんあるんです。これを作るには、ものすごいエネルギーがいる。また、そのエクセルを簡単に作るにはどうしたらいいかっていうことに、しのぎを削っている会社もあるんですね。ただエクセルを使えば使うほど、みんな限界を感じていると思うんです。エクセルやアクセス、ノーツなどのアプリケーションを使いこなしたら、全て何とかなるというわけではないんですね。アプリケーションというのは、ある目的のために専用で使用することを前提としています。例えばエクセルは表計算が出来ますが、実はそれ以外のことはあまり出来ないんです。エクセルに不向きな処理を行うと、果てしなく時間が掛かることもあります。
ビッグデータと呼ばれる巨大なデータを扱う為の専用アプリケーションは実はあまり存在しないんです。じゃあ、そこでエクセルやアクセスなどのアプリケーションを使えるかというと、なかなかピタッとはまらないんです。
そこで私は、OS(基本ソフト)に眼を向けました。OSというのは、+(足す)とか-(引く)、繋げるとか、簡単なことをする道具にしかなりません。ただ、その道具は単純なことしか出来ない代わりに、ものすごく軽いんです。例えば、データの並び替えだけだったら今のパソコンの性能で1億件なら8秒で出来るんです。1千万件なら0.4秒です。
そして並び替える、順番を付ける、足し算、引き算をする、というそれぞれの道具を組み合わせて高速な処理を実現するんです。
実は本当に簡単なプログラムを使って、瞬時に処理をすることが出来る、ということを皆さんに知ってもらいたいです。それはエクセルで式を憶えるのと同じレベルで出来てしまうんです。難しい処理方法とか操作を教えようとかではなく、基本を覚えるだけで世界が変わると思うんです。
データを分析した結果を美しく見せるソフトと、巨大なデータを分析するソフト、この2つに流れは分かれつつあります。美しく表示することは比較的容易ですが、その中身、つまり巨大なデータを分析した結果というのは、人によって差が生まれるところなのです。
その分析の仕方、オリジナリティで競い合っているので、パッケージソフトでは差がなくなってきます。ビッグデータに対して、独自の分析を自由にやりたいと考えている方は非常に増えており、使い方が想定されている出来合いのソフトでは、そのニーズに応えられなくなっているんです。
インソースと共催!1名から参加できるビッグデータ処理入門 ~UNIX/Linuxの基本機能でデータサイエンティストになれるユニケージ開発手法(半日)
「ユニケージ開発手法教育講座」は、これまでもUSP研究所で実施してきた講座なのですが、システムの仕事をされていない方でも十分に理解できる内容になっています。自分でデータ分析したい方、例えば企画やマーケティングの仕事をされている方にも向いていると思います。「データ処理駆け込み寺(仮)」は、つまり自分では直接データ分析するのが難しいんだけど、「こんな風に数字出せないかな」っていう考えがある方の相談に乗ってみよう、というものです。まだまだ考え中ではありますが。
でもなかなか取っ付きにくいと感じる方も多いと思います。かつて、あるクライアントが我々に仕事を依頼してきました。我々は基本ソフトだけを使いこなす技術をずっと追い求めていて、足すとか引くとか繋げるとか、っていう事で全て業務は描けるということを知っているので、それをやって見せていると、そのクライアントの担当者が後ろから見ていて、「このくらいのことだったら僕たちでも出来るぞ。」ということで、後になって勉強して習得したっていうこともあるぐらい、実はみんなが思っているより難しくないんです。
そうです。一昔前のコンピュータの世界は素人には近寄りがたいものでしたが、みんながインターネットを使うようになってきたら、ブログやTwitter、Facebookなんか平気な顔して使いこなしているじゃないですか。それと同じで、今はプログラムというのは専門家以外でも、ちょっとした勉強をすれば誰でも使えるようになっているんです。本当に難しいことではないんです。
また、エクセルでやった方がいい操作、例えばいろいろなグラフで出してみるとか、画面上でシミュレーションをしてみるといった部分までを替えてしまう必要はありません。データのクレンジングや、絞り込み、集計といった、「ビッグデータをエクセルで操作しやすいデータにするまでの前処理」にユニケージ開発手法を使用して、双方のいいとこどりをしていただくと、データ分析がとても効率的になるんです。(下図)
ユニケージ開発手法では、自分でプログラムを書いて、データを自由自在に加工します。エクセルの関数を使ってデータを加工する感覚に似ていますが、画面上のセルの位置を意識する必要がありません。ビッグデータで、セル位置を意識しながらデータ処理をするというのは大変ですよね。ユニケージ開発手法でデータを切り分けたり、つなぎ合わせたりする作業をして、ある程度整理できたら、CSV形式などのテキストデータで簡単にエクセルに渡す、という使い方をお奨めします。
私は料理人みたいなところがあるんですよ。包丁一本で残り物を調理してみせるような。料理人は包丁という道具の使い方を知っているんですが、私は「ユニケージ開発手法」という道具の使い方を知っている。昔はお店とかに行って、その場で実演しながら簡単なシステムを造って、みんなからのリクエストに応えて、いろんな数字なんかを披露していましたよ。
プロフィール
◆當仲 寛哲(とうなか・のぶあき)◆
有限会社ユニバーサル・シェル・プログラミング研究所 代表取締役所長
略歴
雑誌「Software Design」「食品商業」「Enterprisezine」などへの寄稿多数。
一般社団法人 持続可能なモノづくり・人づくり支援協会 理事
特定非営利活動法人 システムイニシアティブ協会 理事