Насекомые (Insecta) мира

Сайт Insecta.pro (бывший Lepidoptera.ru) посвящен одноименному классу беспозвоночных животных. В соответствующих разделах вы найдете обновляемое дерево таксонов, каталог видов насекомых с возможностью отбора по параметрам, многотысячную галерею фотографий, онлайн-сервис для ведения энтомологических коллекций с привязкой к каталогу сайта и возможностью обмена информацией о коллекционных экземплярах с другими пользователями, а также сообщество специалистов и любителей шестиногих.

Sokr.ru - словарь сокращений русского языка

Sokr.ru — самый полный словарь сокращений, акронимов, аббревиатур и сложносоставных слов русского языка.

Словари, созданные на основе НКРЯ

На сайте размещены экспериментальные словари, созданные на основе Национального корпуса русского языка с участием сотрудников Отдела корпусной лингвистики и лингвистической поэтики Института русского языка им. В. В. Виноградова РАН.

Грамматический словарь новых слов русского языка.
Е. А. Гришина, О. Н. Ляшевская

Новый частотный словарь русской лексики.
О. Н. Ляшевская, С. А. Шаров

Русскоязычный корпус проекта Aranea

Araneum Russicum

Русский язык.

  1. Minus (120 M)
  2. Maius (1,20 G)
  3. Maximum (13,7 G)

Araneum Russicum Russicum

Русский язык только на российских доменах (.ru, .su, .рф)

Russian Web corpus (ruTenTen)

ruTenTen: Corpus of the Russian Web

The Russian Web Corpus (ruTenTen) is a language corpus made up of texts collected from the Internet. The corpus belongs to the TenTen corpus family which is a set of the web corpora built using the same method with a target size 10+ billion words. Sketch Engine currently provides access to TenTen corpora in more than 30 languages.

Nuclear Data Services

Российское зеркало базы научных данных по ядерной физике NDS IAEA.

Both the development and maintenance of nuclear technologies rely on the availability of atomic, molecular and nuclear data to provide accurate numerical representations of the underlying physical processes. Essential data include energy-dependent reaction probabilities (cross sections), the energy and angular distributions of reaction products for many combinations of target and projectile, and the atomic and nuclear properties of excited states, and their radioactive decay data.

Информация о юридических лицах и индивидуальных предпринимателях

Rusprofile.ru – надежный и актуальный источник сведений о более чем 9.000.000 юридических лиц и 12.000.000 индивидуальных предпринимателей Российской Федерации!

«Мы странные, замкнутые интроверты»

Аркадий Волож рассуждает о конфликте с Google и «человеческих отношениях» с его основателем, объясняет, почему компания не идет на новые зарубежные рынки, и обещает улучшить «Яндекс.Новости»

Всемирный архив интернета

Всемирный архив интернета хранит старые версии очень многих сайтов за разные даты (с начала 90-ых по настоящее время). 

Можно найти, как веб-страницы, так и изображения и файлы других типов.

Введите адрес страницы и получите её вид при последнем её сохранении сервисом. По календарю можно открутить время назад.

Ссылки на страницах сервиса ведут на такие же сохранённые сервисом копии. При поиске файла, либо вводите в сервис его полный URL, либо найдите ссылку на нужной странице. Можно просмотреть и полный список сохраненных с данного сайта URL.

Генеральный интернет-корпус русского языка (ГИКРЯ)

Генера́льный интерне́т-ко́рпус ру́сского языка́ (ГИКРЯ) [англ. General Internet Corpus of Russian (GICR)] — доступный для поиска электронный онлайновый корпус русских текстов из сети интернет. Открыт в 2013 году. Корпус включает в себя текстовые материалы из блогосферы, социальных сетей, с крупнейших новостных ресурсов и из литературных журналов.

Корпус дает возможность производить:

Список текстовых корпусов на разных языках

Последнее обновление данных: en — 19 июля 2017 г., ru — 1 августа 2017 г.

Приведён список текстовых корпусов на различных языках. В самом низу страницы находятся ссылки на корпуса, описанные на этом сайте.

Хельсинкский аннотированный корпус русских текстов (ХАНКО)

Проект по созданию Хельсинкского аннотированного корпуса русских текстов ХАНКО осуществляется на Отделении славянских и балтийских языков и литератур Хельсинкского университета. Предполагается, что корпус будет содержать морфологическую, синтаксическую и функциональную информацию о текстах общим объемом около 100 тыс. текстоформ, извлеченных из журнала «Итоги».

База данных по терроризму в мире

The Global Terrorism Database (GTD) is an open-source database including information on terrorist events around the world from 1970 through 2015 (with additional annual updates planned for the future). Unlike many other event databases, the GTD includes systematic data on domestic as well as transnational and international terrorist incidents that have occurred during this time period and now includes more than 150,000 cases.