Строим простую картограмму Pandas+Vincent

Добрый день, уважаемые читатели.
В прошлой статье было описано ввдение в визулизацию данных с Pandas и matplotlib. Сегодня же хотелось бы показать еще один способ отображения результатов анализа с помощью Vincent, который так же очень просто интегрируется с Pandas, хотя и займет это чуть больше действий, чем в случае с matplotlib.

Читать

Введение в визуализацию данных при анализе с помощью Pandas

Доброго времени суток, уважаемые читатели.
Как обещалось в предыдущей статье, сегодня я продолжу рассказ о модуле pandas и анализе данных на языке Python. В данной статье хотелось бы затронуть тему быстрой визуализации данных результатов анализа. В этом нам помогут библиотека для визуализации данных matplotlib и среда разработки Spyder.

Читать

Введение в pandas или анализ данных на Python

Сегодня речь пойдет о пакете Pandas. Данный пакет делает Python мощным инструментом для анализа данных. Пакет дает возможность строить сводные таблицы, выполнять группировки, предоставляет удобный доступ к табличным данным, а при наличии mathplotlib дает возможность рисовать графики на полученных наборах данных. Далее будут показаны основы работы с пакетом, такие как загрузка данных, обращение к полям, фильтрация и построение сводных.
Читать

Анализ сложности алгоритмов для начинающих

На днях на Хабре был опубликован перевод статьи A Gentle Introduction to Algorithm Complexity Analysis посвященной анализу алгоритмов. Статья написана на простом и понятном языке, с минимальным использованием математики, что делает ее очень полезной для ознакомления с теорией программирования. В статье доступным языком описано, что такое «нотация О большое» и для каких целей она нужна

Читать

Конференция по web-аналитике iMetrics

Открыта регистрация на ежегодную конференцию по Web-аналитике iMetrics, которая пройдет в Москве 14-15 ноября 2013 . Самым ожидаемым докладчиком является всемирно известный специалист по интернет-маркетингу Тим Эш. Подробней с программой доклада можно ознакомиться здесь.

SQL Saturday в Москве

Тренинг состоится 30 ноября 2013.  Предварительная регистрация уже открыта на странице мероприятия.

SQL Saturday – это бесплатный однодневный тренинг по технологиям Microsoft SQL Server, который проводится в различных странах силами международного сообщества профессиональных DBA и разработчиков под эгидой Professional Association for SQL Server (PASS).

Введение в машинное обучение на python и пакет scikit-learn

Добрый день, уважаемые читатели.  В сегодняшней статье мы с вами рассмотрим основы анализа данных с помощью Python и специального пакета для машинного обучения scikit-learn. На простеньком примере задачи классификации будет показаны основные этапы анализа, такие как:

  • предварительная обработка данных и их кодирование

  • преобразование данных к виду входных данных для применения методов машинного обучения

  • Построение и оценка точности модели.

Читать

Новая версия модуля GeoPandas для Python

Сегодня  в репозитории PyPi выложено обновление модуля GeoPandas.

Данный модуль призван облегчить работу с географическими данными. Модуль позволяет вам с легкостью выполнять операции в Python, которые иначе требуют пространственной базы данных, такой как PostGIS