Rである母集団のdata.frameから除きたい集団data.frameがあって、その結果が欲しいとき

母集団がこんな感じで

population <- data.frame(id=c(1, 2, 3), data=c('a', 'b', 'c'))

  id data
1  1    a
2  2    b
3  3    c

除きたいのがこんな感じのとき

except <- data.frame(id=c(2), data=c('b'))

  id data
1  2    b

で、こんな感じで!とinを使えばいいです

population[!(population$id %in% except$id),,drop=FALSE]

  id data
1  1    a
3  3    c

覚えておいた方がいいのは「drop=FALSE」の部分で、これがないと1列(ベクトル)の時に結果の次元が落ちてしまう(idってのが欲しいのに1 3が返ってくる)

> population <- data.frame(id=c(1, 2, 3))
> except <- data.frame(id=c(2))
> population[!(population$id %in% except$id),]
[1] 1 3

1つめのカンマの前で「どういう行を出すか」、2つめのカラムの前で「どういう列を出すか」(今回の場合は何もないので全て)、その後にoptionだと思えば良い

Rubyで2つの日付を元にからその間の月を全部出す

パッとググった感じこんなんでよさそう

#!ruby
require 'date'

(Date.parse("2010-08-01")..Date.parse("2012-11-07")).each{|i|
    next if i.strftime('%d') != '01'
    puts i.strftime('%Y%m')
}

参考:rubyなら日付を連続10日分の日付作るのがアツ−!と言う間です - それマグで!

追記

何かeachの中でnextっておかしいね。returnの方がいいんだろうか

Rで日付を出す。月の連番を出す。

RでSQL作るときとかに今月から半年分くらいの月が欲しかったりするんだけど、そんなときはSys.Date()使えばいい。

> paste(format(seq(Sys.Date(), length.out=6, by="-1 month"), "%Y%m"), collapse=", ")
[1] "201210, 201209, 201208, 201207, 201206, 201205"
  1. 現在の日付を取って、
  2. そこから-1ヶ月ずつ6個作り、
  3. formatを%Y%mにして、
  4. ", "で連結して文字列化

いろんな会社のいろんな人の話を聞けるのはやっぱり楽しい!YAPC::Asia Tokyo 2012に参加して来た!

こんにちは!こんにちは!monmonといいます!



2009年に初めて参加して、一昨年去年に引き続き今年もスタッフとして参加させてもらいました。



3年続けてスタッフ参加だったためメインホールのリーダー担当を任されたんですが、今回は初めての場所ということもあって失敗しないか心配で仕方なかったです。



と、失敗してない風なこと言いましたが、2日目におもいきりやらかしました。
「一番長いのが40分と思い込んでた」+「東大の学食に行ったら長蛇の列で帰って来たのが始まる5分前だった」の結果、
Perl 今昔物語のときに勘違いして10分前カンペ出してしまい、馮さんが941さんに「あれ?60分でしたよね?」と聞かなくてはいけないはめに。

すみません、僕のカンペのせいですみません。
慣れない学食なんて行くもんじゃないなってのと、ちゃんと時間は確認しないとダメだと心に刻みました。



ただ、こういう失敗はあったものの、スタッフ全体の動きはスムーズでした。
何かあればLINEでやり取りをして解決していたため、以前のようにバタバタすることがなかったなぁと思います。
# 去年はfacebookメッセージでやり取りをしたんですが、LINEの方がみんなに合っていたからなのか、去年よりもやり取りが活発でした。



会場の準備や片付けについても、牧さん941さんをはじめとする実行委員の人たちのノウハウとスタッフの数の多さのおかげでホントにビックリするくらいな順調具合。最後も「本当にもう終わっちゃうの?!」という感じであっという間に終わってしまい「でかいイベントなのに手際良くてすごいなぁすごいなぁ」という第三者目線で感動してました。

準備のワンシーンとして恒例となったZIGOROuメソッド(いわゆるバケツリレー)でのノベルティ詰めも貼っておきます。

この流れ作業、近くの人とワイワイ話すきっかけにもなってスタッフ間の交流に一役かっているんじゃないだろうかと感じてます。
スタッフ間でのぼっち対策ですね。



そうそう、話が前後しますが、今回僕は少し早めに着いたので他の人が来る間あんちぽさんのSQALEプロマイドを一人で堪能してました。

これはその夜の風景。

あんちぽさんに「どれが当たりですか?」とみんなで聞いているところです。
# ちなみに当たりは草原でかわいいポーズ取っているやつ。
# Ricoさんがコンプさせてたので参考:https://twitter.com/RicoImazu/status/251875701408550912



話がそれた。



去年も一昨年も思ったんですが、941さんのイベントを回す動きはすごいですね。準備の仕方、指示の出し方、問題回避ととっさの対応、業者さんへの直接ダメ出し、と、イベントをやるような人にとっては勉強になることたくさんあるだろうなぁと改めて思いました。



さて、スタッフの話はこの辺にして。
今回はメインホール担当だったのでトークもいくつか聞くことができました。



僕の印象に残っているトークはtypesterさんの「Perlハッカーは息をするようにCPANモジュールを書く。」です。
既にスライドは上がっていますが、
「そのモジュールを作った熱い想いをドキュメントに書こう!」
の流れはスライドではなく動画で観た方がいいので動画が上がったら観てみてください。



このトークの中に出てくる「ドキュメントは熱い想いをぶつけるところ」って表現がとても好きです。
僕は仕事をしているときに「こういうやり方もできたんだけど、〜って理由があったからこのやり方でやったんだ」というのを知るとだいぶ仕事がやり易くなります。
作った人のポリシーみたいなものが見えていると、それだけで「なんでここはこうなの?」的な面倒なやり取りがだいぶ減ってコストが下がるんです。
そういう相手の場合、その人が作る物がどういうものなのかがだんだんわかってきて、ますます仕事がやりやすくなり、そしてもう何て言うかとても楽なんです。なんでですかね、癖みたいな物がわかるってことなんですかね。
なので「ドキュメントに熱い想い」ってのはいい表現だなぁと。
とてもいい表現なので会社でも使いたいなと思っています。



もう一つ印象に残っているトークは最後のmizzyさんの話。

話を聞きながら

ってtweetもしたし、社内の日報にも「新人の子たちは動画観るといいよ」って感想を書きました。



去年のhidekさんの話もそうだけど、YAPCに来るといろんな会社のいろんな人の思いが聞けて楽しいです。
飲みに行ったりすれば聞けるんだろうけど、こんなにいっぺんにいろんな人の話が聞ける機会ってやっぱりそうそうないから、「どういう考え方でコードを書いている」「どういう考え方でサービスを作っている」「どういう考え方で行動している」みたいな話が聞けるのは貴重だなと感じています。
しかも一方通行で聞くだけではなく、質問すれば聞きたいことがもっと聞ける。とても楽しいです。



スタッフも楽しいけど話す側も楽しそうだから次回はそっちもやろうと思います。
次回のYAPC::Asiaも楽しみです!



最後に、今回も牧さん941さん長い期間かけての準備おつかれさまでした!ありがとうございました!

他のbranchの内容を調べる時はgit grepしてgit showする

「前に書いたmethodがなくなってるなぁ」
「あぁ、あれ違うbranchで作ったmethodか」
みたいなことを調べる時にタイトルのようにやればいいみたい。

まずはgit grepで違うbranchから探したいものを検索

 (git)-[hotfix/2.4.20]-[12:30]% git grep isUniqueWith feature/m48                                                                     [/Applications/MAMP/htdocs/lib]
feature/m48:app/Model/Enticement.php:            'isUniqueWith' => array(
feature/m48:app/Model/Enticement.php:                           'rule' => array('isUniqueWith', 'company'),
feature/m48:app/Model/Enticement.php:    public function isUniqueWith($data, $fields)

CakePHPでDBのExceptionが起こった時にどういうSQLを投げたためかをログに吐く

何か変なqueryをMySQLに投げてしまって

2012-05-26 18:23:21 Error: SQLSTATE[23000]: Integrity constraint violation: 1452 Cannot add or update a child row: a foreign key constraint fails (`test`.`user_logs`, CONSTRAINT `user_logs_ibfk_1` FOREIGN KEY (`user_id`) REFERENCES `users` (`id`))

みたいな感じでPDOExceptionが発生した場合に、どんなSQLを実行したのかがわからなくて困ったので調べた。



debugモードであればqueriesLogに保存されてそれを覗けばわかるのだけど、本番だとqueriesLogには保存されないのでそれだとダメ。
ググっても「queriesLog覗けばいいよ」とか「getLog()実行すればいい」的なのばかり出て来てなかなか欲しい情報にたどり着けず。
# というか、結局エラーが出た時にSQLが調べられればいいのでdebugモードのときみたいに常にある必要はない



で、ソース見たらあった。

<?php
// https://github.com/cakephp/cakephp/blob/master/lib/Cake/Model/Datasource/DboSource.php#L449
		} catch (PDOException $e) {
			if (isset($query->queryString)) {
				$e->queryString = $query->queryString;
			} else {
				$e->queryString = $sql;
			}
			throw $e;
		}

PDEOExceptionが起こった時に$eのqueryStringに突っ込んでる。
なのでexceptionで捕まえた時にコレをそのままログに吐けばいい。



ってことで、AppModelの中でException捕まえて、その中で

<?php
CakeLog::write('error', $e->getMessage());
CakeLog::write('error', $e->queryString);

みたいな感じでログに吐くことにした。
結果、

Error: SQLSTATE[23000]: Integrity constraint violation: 1452 Cannot add or update a child row: a foreign key constraint fails (`test`.`user_logs`, CONSTRAINT `user_logs_ibfk_1` FOREIGN KEY (`user_id`) REFERENCES `users` (`id`))
Error: INSERT INTO `test`.`user_logs` (`is_error`, `modified`, `created`) VALUES ('1', '2012-05-26 18:23:20', '2012-05-26 18:23:20')

こんな感じでログが吐かれる

CakePHPでwhere句のINの並び順で結果をsortしたいときはORDER BY FIELDを使う

where句のINの並び順で結果をsortしたいときはORDER BY FIELDを使うの続き

findのorderの所で

<?php
array('order' => array('FIELD(Country.id, 4, 1, 5, 3, 6, 2)'))

と書けばいい。

参照

http://cakebaker.42dh.com/2008/06/10/order-by-field/

Ok, let’s do some examples to learn more about it. We will use the following countries table:
[1] => USA
[2] => Germany
[3] => Russia
[4] => Austria
[5] => China
[6] => Switzerland
Now, we don’t want to sort them by the id, but by some “strange” order: Austria, USA, China, Russia, Switzerland, Germany. For this purpose we can use “order by field”: the first parameter is the column name and all following parameters are values of the respective column. In CakePHP it is done in the following way:

<?php
$this->Country->find('list', array('order' => array('FIELD(Country.id, 4, 1, 5, 3, 6, 2)')));

And we get the expected result:
[4] => Austria
[1] => USA
[5] => China
[3] => Russia
[6] => Switzerland
[2] => Germany