ПерваяНовостиО технологииOn-line переводчикСсылки


Ukraine Context Optimizer.Технологии информационного поиска


НОВОСТИ

03.02.2010
Новости компании "Эр-Си-О"

Основная форма работы компании - это выполнение заказных проектных решений с использованием готовых программных компонент собственной разработки. Ключевые из этих компонент предлагаются нами также в виде "коробочных" продуктов для разработки заказчиками своих собственных приложений. Они необходимы для создания современных информационно-поисковых и информационно-аналитических систем, эффективно работающих с электронными документами и базами данных на русском и английском языках.
Эволюция используемых нами подходов к обработке текстовой информации, достаточно полно отраженная в публикациях за последние 15 лет, привела к развитию сложных лингвистических алгоритмов, которые позволяют проводить синтаксический анализ и семантическую интерпретацию текста на естественном языке, целенаправленно извлекать информацию и структурировать ее в соответствии с заданной моделью предметной области.
Исследования в области математической обработки текстовых данных привели к разработке множества эффективных программных решений для поиска, сравнения, классификации, идентификации текстов и объектов в базах данных.
Специалисты компании ЭР СИ О имеют большой практический опыт разработки решений для государственных и коммерческих структур в различных предметных областях.
Вот некоторые области применения наших программ:
• мониторинг деятельности хозяйствующих субъектов и конкурентная разведка;
• сбор фактографических данных;
• поиск криминальных связей для служб безопасности;
• анализ освещения и оценки общественно-политических событий в СМИ;
• анализ отзывов (мнений) о людях, компаниях и товарах;
• автоматическое рубрицирование, новостная агрегация;
• построение тезаурусов для ИПС (юриспруденция, нанотехнологии)
• выявление тем исследований и экспертов в научных сообществах;
• ввод информации в БД из текстов досье на персоны и организации;
• расстановка ссылок в текстах нормативно-правовых документов;
• вымарывание персональных данных из судебных решений;
• обработка запросов к поисковым машинам на естественном языке;
• поиск похожих фрагментов текста, цитирований и заимствований;
• нормализация и идентификация данных о персонах и организациях в БД;
Технологии ЭР СИ О прошли успешную апробацию на обработке текстов самых различных стилей: СМИ, нормативно-правовые документы, научно-технические отчеты, досье, сводки, социальные сети Интернета, web-сайты, записи баз данных (анкеты, реестры физических и юридических лиц, сообщения о банковских операциях и др.).
Вот типовые задачи, которые мы эффективно решаем с помощью компьютерной обработки текста:
• для текстов СМИ: выявление упоминаний персон и организаций, извлечение фактов заданного типа и их участников (биографические данные, связи, владение собственностью, экономические показатели, что он говорит и что о нем говорят), мониторинг упоминаний о событиях заданного типа (кадровые перестановки, купля-продажа, договора, судебные разбирательства, расходы бюджета, законотворчество), новостная агрегация (группировка текстов в сюжеты), автоматическое рубрицирование;
• для научно-технических отчетов и статей: построение тезаурусов понятий и связей предметной области, выявления направлений проводимых исследований и достигнутых результатов, специалистов в соответствующих областях, распознавание ссылок на публикации и построение индексов цитирования, выявление плагиата и повторений научных исследований;
• для социальных сетей Интернета: анализ мнений, предпочтений и интересов (какими эпитетами награждают губернатора Чукотки в блогах ЖЖ? Чем интересуются члены автомобильного сообщества ЖЖ? Что любят и покупают те, кто упоминает слово "пиво" в Одноклассниках?);
• для нормативно-правовых документов: идентификация в тексте ссылок на документы, поиск похожих судебных решений, вымарывание персональных данных, автоматическое рубрицирование;
• для досье, биографий, технических описаний, "карточек" проектов и прочих документов специального вида: извлечение фактографических данных, стандартизация и ввод в базу данных;
• для запросов к поисковым машинам: разбор запроса на естественном языке и трансляция в релевантные запросы на языке поисковика, расширение слов запроса всеми грамматическими формами;
• для записей в базе данных: стандартизация записей ФИО и наименований организаций, извлечение реквизитов из несоответствующих им полей, идентификация записей о физических и юридических лицах с опорной базой, формирование единого реестра физических и юридических лиц из различных источников, нормализация российских почтовых адресов и восстановление пропущенных компонент адреса на основе классификатора КЛАДР.




Все новости

Новости компании "Эр-Си-О" [03.02.2010]

Разбор частично-структурированного текста. [03.02.2010]

Очистка информации в базах данных. [03.02.2010]

Поиск похожих фрагментов текста. [03.02.2010]

Извлечение знаний из текста и их обработка: состояние и перспективы. [03.02.2010]

"Обработка естественно-языковых запросов к поисковой машине на основе их лингвистического анализа". [02.06.2009]

Компания RCO анонсирует расширения для продукта IBM OmniFind. [01.10.2008]

Появилось описание библиотеки семантических шаблонов [24.09.2008]

Статья "Практические применения анализа текстовой информации" директора компании "Текон" Коржова Е.И. опубликованная в журнале "Копоративные системы" №4/2008г. [24.09.2008]

Вышла новая версия пакета лингвистического анализа русского текста RCO Fact Extractor SDK 2.0 [28.07.2008]

Статья директора компании «Текон» Евгения Коржова «UOSES: «правовой» доступ к информации в корпорации» в журнале «Директор Информационной службы» №3/2008 г. [24.06.2008]

Статья "Лингвистика для бизнеса: поиск общего языка" директора компании "Текон" Коржова Е.И. "Корпоративная информация: особенности поиска" опубликованная в журнале "Копоративные системы" №3/2008г. [13.06.2008]

Участие в конференции Диалог [12.06.2008]

Технологии RCO на Украине [25.04.2008]

Статья диретора компании "Текон" Коржова Е.И. "Корпоративная информация: особенности поиска" опубликованная в журнале "Копоративные системы" №2/2008г. [10.04.2008]

Статья "Украинизация лингвистических возможностей ORACLE" [10.04.2008]

Автоматизация государственного языка [12.03.2008]

Решения RCO внедрены в новостной агрегатор CNews Дайджест. [31.01.2008]

RCO Fact Extractor SDK - новый пакет для анализа текста [30.10.2007]

Технологии RCO в новой системе для поиска данных в корпоративной информационной среде - ROSES [16.10.2007]

ФОРС выводит на рынок РФ поисковую систему для корпоративных сетей [15.10.2007]

Компания "Текон" зарегистрировала торговый знак "UCO". [17.08.2007]

Участие в конференции Диалог'2007 "Компьютерная лингвистика и интеллектуальные технологии" [06.06.2007]

Russian Context Optimizer - RCO. [25.04.2007]

Открыт английский сайт RCO. [19.03.2007]

RCO представляет последние разработки на CEBIT'2007 [14.03.2007]

RCO Fact Extractor "завалил" серебряного ЗУБРа! [02.03.2007]

Новые версии RCO Semantic Entity Extractor SDK и RCO Fact Extractor SDK. [19.10.2006]

Статья "Технологии извлечения знаний из текста". [18.09.2006]

Статья "Мост между мирами" [09.08.2006]

Выход очередной версии UCO для Оракл (Oracle). [21.04.2006]

Обновлен ассортимент программных продуктов RCO и политика их лицензирования [05.12.2005]

RCO for BackOffice дополнен инструментарием для разработчиков информационно-поисковых систем [28.09.2005]

Для ТНК-ВР создан и запущен в эксплуатацию новый двуязычный интранет-сайт проекта по реинжинирингу системы снабжения (SPR). [15.08.2005]

Участие наших партнеров Гарант-Парк_интернет в Международной конференции Диалог [16.06.2005]

GTRF.ru: записи общей продолжительностью 15 лет [05.05.2005]

Группа ИСТ ЛАЙН использует интранет-технологии для формирования корпоративной культуры [05.05.2005]

На сайте наших партнеров "Гарант-Парк-Интернет" обновлен раздел "Технологии" [05.04.2005]

Доклад "Текон" - Технологии анализа и поиска текстовой информации. Ukraine Context Optimizer для платформы Windows & Linux. [22.02.2005]

Участие "Текон" в семинаре для разработчиков программного обеспечения на базе технологий Oracle. [15.02.2005]

19-20 января 2005 специалисты компании "Гарант-Парк-Интернет" приняли участие в 3-ей конференции "Конкурентная разведка в металлургии", проходившей в Москве в гостинице «Балчуг Кемпински». [28.01.2005]

Программа для поиска фактов в тексте RCO Fact Extractor 1.0 [12.01.2005]

Новый генератор отчетов для корпоративных хранилищ текстовой информации масштаба предприятия. [16.11.2004]

Веб-сервис в приложениях Microsoft Office 2003. [09.11.2004]

Online-заказы на продукты RCO. [04.11.2004]

Открытие первого этапа проекта. [27.10.2004]

“Гарант-Парк-Интернет” приняла участие в семинаре по оценке методов информационного поиска РОМИП'2004 [07.10.2004]

Aladdin и «Гарант-Парк-Интернет»: новое партнерство, новые перспективы [04.10.2004]

Oracle буде «розмовляти» українською. [20.09.2004]

Программный продукт RCO for Backoffice исправляет ошибки Microsoft [17.09.2004]

Библиотека анализа текста RCO Semantic Network 3.0 – инструмент для компьютерной разведки [17.09.2004]

Гарант-Парк-Интернет и TECON продвигают поисковые технологии RCO® в Украине. [12.09.2004]







Авторское право © Компания Текон & Студия РОМАрт, 2004-.
UCO™ является торговой маркой компаний Текон и "ЭР СИ О".
RCO™ является торговой маркой компании "ЭР СИ О".
Все права защищены.


Яндекс цитирования