![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
У меня кризис:
во-первых мне рекомендовали книжку, я забыла ее название и автора, и теперь уже неделю не могу ее найти, при всей моей нежной дружбе с Гуглом. Сегодня спрашивала в четырех книжных магазинах, и все без толку.
во вторых, у меня чешутся руки поиграться с Hadoop, но я тупо не могу придумать, что именно ему скормить. Как бы по идее должно быть очень много неструктирированных машинно-произведенных текстовых данных. GIS, например. Flickr-овские метаданные через API? Поискать что-то в GoogleBooks? Что?
Была еще мысль, запустить туда логи. Ну у меня кроме билдов и информиксовской статистики под рукой ничего нет, да и объемы не те.
Вот.
во-первых мне рекомендовали книжку, я забыла ее название и автора, и теперь уже неделю не могу ее найти, при всей моей нежной дружбе с Гуглом. Сегодня спрашивала в четырех книжных магазинах, и все без толку.
во вторых, у меня чешутся руки поиграться с Hadoop, но я тупо не могу придумать, что именно ему скормить. Как бы по идее должно быть очень много неструктирированных машинно-произведенных текстовых данных. GIS, например. Flickr-овские метаданные через API? Поискать что-то в GoogleBooks? Что?
Была еще мысль, запустить туда логи. Ну у меня кроме билдов и информиксовской статистики под рукой ничего нет, да и объемы не те.
Вот.