2016年11月16日水曜日

sed

昨日のコンタミ発覚により、気になっていた、卒論の怪しいデータをBLASTにかけたら全てサソリモドキに完全一致した。

もちろん、当時もBLASTを試したのだが、サソリモドキのデータがアップされていなかったので、良く分からなかった。結構な数ある。

かなりまずい状況に自ら追い込んでしまった、週末の会議用解析。

他人のデータではいまいちやる気が起きないので、外来性ワラジムシ類の解析を行うことにしたのだが、真面目に自分のデータを見ると色々と問題があることに気づく。

標本1個体ずつに固有の番号を付けて整理しているのだが、その時、採集地点は緯度経度ではなく通し番号(Fuku-0001とか)をつけている。


で、採集地点は別ファイルで、採集番号、緯度経度データ、地名などが整理されている。


今回の解析で使いたいのは、500地点の約17000個体。

で、ここで大きな問題。この全て標本に緯度経度データを付けなければならない。置換をすれば良いだが、500地点あるので、500回繰り返すのか、、、。

そんはずはないと、ネット検索。sedというテキスト変換のプログラミングでどうにかなりそうだと分かった。一瞬で終わった。

しかし、不在データの作成にてこづる。これも良い方法があるはずだとほぼ半日ネット検索したが、解決策は見つからず、結局、手入力してしまった。

在・不在データを作成したところで終了。合間に本読みゼミもやった。

あと2日で解析と報告書とプレゼン準備、、、そして、授業の準備が手付かず。