СУБД Apache Cassandra 1.0 готова к промышленному использованию

23/10/2011 17:48

Разработчики Apache Software Foundation анонсировали выход первого крупного релиза распределенной СУБД с открытым кодом Apache Cassandra версии 1.0. Cassandra — распределенная система управления базами данных, относящая к категории «NoSQL» (данные хранит как структурированный набор ключей-значений). Её исходный код распространяется под лицензией Apache License v2, поддержкой и развитием занимается некоммерческая организация Apache Software Foundation (ASF). На коммерциализации проекта специализируется компания DataStax, техническим директором которой является Джонатан Эллис (Jonathan Ellis), один из лидеров этого Open Source-проекта. Изначально Cassandra была создана в Facebook для быстрой обработки огромных объемов данных: популярнейшая социальная сеть так и остается её важным «пользователем». К нему присоединились такие компании и сервисы, как Cisco, Digg, Netflix, Reddit, Twitter и Walmart. С выпуском Apache Cassandra 1.0 эта СУБД позиционируется как готовая для промышленного использования и достаточно простая в администрировании. Впрочем, глядя на нынешних «пользователей» Cassandra, всё это можно назвать формальностями. Тем не менее, из возможностей СУБД, относящихся к категории enterprise, называют сжатие данных для экономии места на дисках, оптимизация распределения данных в фоновом режиме, специальные механизмы для эффективного использования оперативной памяти. Особое внимание уделяется производительности: например, если сравнить скорость чтения данных в Cassandra 0.6 и 1.0, то она увеличилась на 400 процентов (скорость записи за это же время возросла на 40 %). Крупнейшая инсталляция Cassandra запущена на кластере из 300 серверов, хранящих более 300 терабайт данных. Каждый узел обрабатывает более 5000 запросов в секунду.

Источник