Google Compute Engine теперь доступен для всех

Компания Google наконец-то открыла для всех желающих сервис облачных вычислений Google Compute Engine (GCE), анонсированный полтора года назад. Учитывая опыт компании Google в разработке масштабируемых решений, сервисов для разработчиков и самый большой в мире парк серверов, GCE вполне может составить конкуренцию EC2.

Ко дню премьеры приурочено ещё несколько приятных фишек:

  • снижены цены на инстансы на 10%;
  • поддержка 16-ядерных инстансов (до 104 ГБ RAM) для высокопроизводительных вычислений и баз NoSQL;
  • кроме Debian и CentOS с ядром от Google, теперь в виртуальных машинах можно запускать FreeBSD и любые дистрибутивы Linux с любыми ядрами и программным обеспечением, включая DockerFOGxfs и aufs.

Источник: habrahabr.ru

Отчет о решении задачи кредитного скоринга с помощью python

Введение

Добрый день, уважаемые читатели.
Недавно, бродя по просторам глобальной паутины, я наткнулся на турнир, который проводился банком ТКС в начале этого года. Ознакомившись с заданиями, я решил проверить свои навыки в анализе данных на них.
Начать проверку я решил с задачи о скоринге (Задание №3). Для ее решения я, как всегда, использовал Python с аналитическими модулями pandas и scikit-learn.

Читать

Введение в анализ данных с помощью pandas и scikit-learn

Добрый день уважаемые читатели. В сегодняшней посте я продолжу свой цикл статей посвященный анализу данных на python c помощью модуля Pandas и расскажу один из вариантов использования данного модуля в связке с модулем для машинного обучения scikit-learn. Работа данной связки будет показана на примере задачи про спасенных с «Титаника&quot. Данное задание имеет большую популярность среди людей, только начинающих заниматься анализом данных и машинным обучением.

Читать

Строим простую картограмму Pandas+Vincent

Добрый день, уважаемые читатели.
В прошлой статье было описано ввдение в визулизацию данных с Pandas и matplotlib. Сегодня же хотелось бы показать еще один способ отображения результатов анализа с помощью Vincent, который так же очень просто интегрируется с Pandas, хотя и займет это чуть больше действий, чем в случае с matplotlib.

Читать

Введение в визуализацию данных при анализе с помощью Pandas

Доброго времени суток, уважаемые читатели.
Как обещалось в предыдущей статье, сегодня я продолжу рассказ о модуле pandas и анализе данных на языке Python. В данной статье хотелось бы затронуть тему быстрой визуализации данных результатов анализа. В этом нам помогут библиотека для визуализации данных matplotlib и среда разработки Spyder.

Читать

Введение в pandas или анализ данных на Python

Сегодня речь пойдет о пакете Pandas. Данный пакет делает Python мощным инструментом для анализа данных. Пакет дает возможность строить сводные таблицы, выполнять группировки, предоставляет удобный доступ к табличным данным, а при наличии mathplotlib дает возможность рисовать графики на полученных наборах данных. Далее будут показаны основы работы с пакетом, такие как загрузка данных, обращение к полям, фильтрация и построение сводных.
Читать

Анализ сложности алгоритмов для начинающих

На днях на Хабре был опубликован перевод статьи A Gentle Introduction to Algorithm Complexity Analysis посвященной анализу алгоритмов. Статья написана на простом и понятном языке, с минимальным использованием математики, что делает ее очень полезной для ознакомления с теорией программирования. В статье доступным языком описано, что такое «нотация О большое» и для каких целей она нужна

Читать

Конференция по web-аналитике iMetrics

Открыта регистрация на ежегодную конференцию по Web-аналитике iMetrics, которая пройдет в Москве 14-15 ноября 2013 . Самым ожидаемым докладчиком является всемирно известный специалист по интернет-маркетингу Тим Эш. Подробней с программой доклада можно ознакомиться здесь.

SQL Saturday в Москве

Тренинг состоится 30 ноября 2013.  Предварительная регистрация уже открыта на странице мероприятия.

SQL Saturday – это бесплатный однодневный тренинг по технологиям Microsoft SQL Server, который проводится в различных странах силами международного сообщества профессиональных DBA и разработчиков под эгидой Professional Association for SQL Server (PASS).

Введение в машинное обучение на python и пакет scikit-learn

Добрый день, уважаемые читатели.  В сегодняшней статье мы с вами рассмотрим основы анализа данных с помощью Python и специального пакета для машинного обучения scikit-learn. На простеньком примере задачи классификации будет показаны основные этапы анализа, такие как:

  • предварительная обработка данных и их кодирование

  • преобразование данных к виду входных данных для применения методов машинного обучения

  • Построение и оценка точности модели.

Читать