SlideShare a Scribd company logo
Talend Data QualityПлатформа управления клиентскими данными
СодержаниеО компаниях Talend и ItransitionОбласти применения платформы решений TalendВарианты использования платформы Talend Data Quality
О компании Itransition10 лет на рынке ИТВ штате компании более 600 специалистов№1 по темпам роста в 2009 гг. в РоссииПрестижные премии в  сфере бизнеса и ИТСервисный партнер SAPСертифицированный партнер MicrosoftПартнер Rackspace, Broad Vision, NorthGate Arinso, Talend
О компании5 лет на мировом рынке ИТПоказатели востребованости продуктов:10 миллионов загрузок за все время существования450 000 пользователей1 500 заказчиков100 новых заказчиков в месяц1 загрузка Talend Open Studio в минуту
Области применения решений TalendMDMКачество данныхУправление справочными даннымиПрофилированиеи очисткаданныхИнтеграция данныхФункциональная интеграцияАналитика (ETL)Оперативный обмен данными между информационными системами.Извлечение, преобразование и загрузка  данных для  систем, обеспечивающих принятие решений
Talend Data QualityВарианты использования:Управление справочной информациейОперационное использованиеАналитическое использование
Управление справочнойинформациейИнформационная система № 1Информационная система № 2ВЫБОРКА ОБНОВЛЕНИЙВЫБОРКА ОБНОВЛЕНИЙКОНСОЛИДАЦИЯДАННЫЕДАННЫЕПОИСК ДУБЛИКАТОВПОЛЬЗОВАТЕЛЬСЛИЯНИЕЗАГРУЗКА ОБНОВЛЕНИЙЗАГРУЗКА ОБНОВЛЕНИЙОБНОВЛЕНИЕ CDIMDM-CDI ХРАНИЛИЩЕВЫБОРКА ОБНОВЛЕНИЙ
Решаемые задачиСоздание модели данных
Организация доступа к модели данных пользователям
Создание  механизмов интеграции данных
Создание  механизмов контроля качества данныхTIS StudioTALENDMDM STUDIOAdministration& MonitoringData StewardshipConsoleTalend Web UIExecution ServerTalend  Administration CenterСхема развертыванияTalend MDM ServerExecution ServerAdmin MetadataActivity Monitoring ConsoleМодель и данныеМетаданных проекта
Создание моделей данныхИнструмент: Talend MDM StudioВозможности:Проектирование модели данныхУправление представлением данныхФормирование правил контроля качества хранимых данныхОрганизация доступа к данным
Модель данныхФизическая область хранения метаданных и данныхБиблиотекатиповФИЗИЧЕСКИЙ АДРЕСЮРИДИЧЕСКИЙ АДРЕСАДРЕС ДОСТАВКИКонтейнер данныхINSURANCEМодель данных                  INSURANCEПравила проверки данныхТипы данныхБезопасностьАДРЕСИНДЕНТИФИКАЦИОН- НЫЙ ДОКУМЕНТТЕЛЕФОННЫЙНОМЕРПАСПОРТПРАВАМОБИЛЬНЫЙ ТЕЛЕФОНРАБОЧИЙ ТЕЛЕФОНФАКСМодель данныхЛогическая структура описывающая модель основных данных
Управление сущностямиПовторное использование (Типизация)СУЩНОСТЬАТРИБУТАННОТАЦИЯАННОТАЦИЯКЛИЕНТНОМЕР ПАСПОРТАПростые типыТипизацияСложные типыВозможностиУправление отображениемУправление доступСвязывание сущностейПроверка вводимых данных
Аннотации, управление отображениемУправление сообщениямиоб ошибкахОбязательное полеУправление форматомизображения9 Января 1977 г.1977 – 01 – 09Дата рождения*Место рождения:Управление описаниемполяУправление названиемполяПол:          Муж.           Жен.Дата рождения клиентафизического лицаДата рождения
Аннотации, управление отображениемУправление сообщениямиоб ошибкахMandatory fieldУправление форматомизображения9 Jan 1977 г.1977 – 01 – 09Birthday*Место рождения:Управление описаниемполяУправление названиемполяПол:          Муж.           Жен.Client birthdayBirthday
Аннотации, связывание сущностейТелефонКлиентЗНАЧЕНИЯАТРИБУТЫЗНАЧЕНИЯАТРИБУТЫ10ИДЕНТИФИКАТОР7ТЕЛЕФОННЫЙ КОД СТРАНЫТЕЛЕФОННЫЙНОМЕР10495ТЕЛЕФОНННЫЙ КОД ГОРОДА+758-13-12ТЕЛЕФОННЫЙ НОМЕРМОБИЛЬНЫЙТИП ТЕЛЕФОННОГО НОМЕРАОтображаемое значение7 – 495 – 758 – 13 – 12
Аннотации, управление доступомОБЛАСТЬ ВИДИМОСТИКАНАЛ ПРОДАЖДОГОВОРКЛИЕНТТипМенеджерНомерДатаПродуктСуммаИмяОтчествоФамилияПолДата рожденияПаспортТелефонАдресОБЛАСТЬИЗМЕНЕНИЯ
Проверка соответствиятребованиям форматасерии паспортаАннотации, контроль вводаКлиент…Проверка соответствиятребованиям форматаномера паспорта112342Паспорт серия:123456Паспорт номер:Проверка наличиязаполненных данныхМосква, ул. Ленина, 12Адрес:me@me.comE-mail:Проверка правильности заполнения E-mail…
Управление ролямиРОЛЬ 1СущностиАтрибутыКлиентыПредставленияОграниченный набор клиентовПОЛЬЗОВАТЕЛЬДействияРОЛЬ 2РОЛЬ …
Базовые ролиРазработка механизмов интеграций данныхРазработка механизмов контроля качества данныхАДМИНИСТРАТОРРазработка модели данныхЛИЦЕНЗИРУЕМАЯ  ДЕЯТЕЛЬНОСТЬРабота с основными данными используя APIВНЕШНИЕ СИСТЕМЫПОЛЬЗОВАТЕЛЬРабота с данными через порталПОЛЬЗОВАТЕЛЬ ПОРТАЛАПросмотр данных через портал
ДемонстрацияВозможности Talend MDM Studio по работе с моделями данных:СущностиАтрибутыАннотацииРоли
Организация доступа к даннымиИнструмент: Talend Web UI (портал)Возможности:Создание, редактирование, удаление клиентских данныхРабота с иерархиями записейо клиентахУправление пользователями
ПредставленияАтрибуты, входящие в результаты поискаТелефонСегментКонтактное лицоФ.И.О.Ограничение набора доступных записейСидоров С.С.ОСАГО+7 916 4008031Иванов И.И.Смирнов И.И.ОСАГОПетров П.П.+7 916 8004031Петров П.П.+7 916 3104080КАСКОСидоров И.И.Иванов И.И.Смирнов С.С.ДМС+7 916 8104031Атрибуты,входящие в условия поиска
Иерархии, группировкиФизические лицаФ.И.О.СегментОСАГОДМСКАСКОИванов Иван ИвановичПетров Петр ПетровичСмирнов Иван ИвановичИванов ИванИвановичОСАГОСидоров Сергей СергеевичПетров Петр ПетровичДМССмирнов Иван ИвановичКАСКОСидоров Сергей СергеевичОСАГО
Иерархии, взаимосвязиФизические лицаИванов И.И.Ф.И.О.Контактное лицоСидоров С.С.Иванов И.И.Сидоров С.С.Иванов И.И.Петров П.П.Смирнов И.И.Петров П.П.Смирнов И.И.Смирнов И.И.Петров П.П.Сидоров И.И.Петров П.П.Сидоров С.С.Иванов И.И.Смирнов С.С.Иванов И.И.Сидоров С.С.
Управление пользователямиАдминистраторыПОЛЬЗОВАТЕЛЬИдентификаторИмяФамилияE-mailСтатусВнешниесистемыИЛИПользователипорталаДополнительнонастраиваемые роли
ДемонстрацияДемонстрация Talend MDM Studio:Работа с представлениямиДемонстрация портала по работе с клиентскими данными Web UI:Просмотр данныхИерархииПользователи
Управление справочнойинформациейИнформационная система № 1Информационная система № 2ВЫБОРКА ОБНОВЛЕНИЙВЫБОРКА ОБНОВЛЕНИЙКОНСОЛИДАЦИЯДАННЫЕДАННЫЕПОИСК ДУБЛИКАТОВПОЛЬЗОВАТЕЛЬСЛИЯНИЕЗАГРУЗКА ОБНОВЛЕНИЙЗАГРУЗКА ОБНОВЛЕНИЙОБНОВЛЕНИЕ CDIMDM-CDI ХРАНИЛИЩЕВЫБОРКА ОБНОВЛЕНИЙ
Создание механизмов интеграции данныхИнструмент: Talend MDM StudioВозможности:Разработка механизмов выборки данных из операционных системРазработка механизмов трансформации данныхРазработка механизмов загрузки данных в MDM-CDI хранилище
Механизмы интеграции и контроля качестваРабота TalendРаботаКомпонентКомпонентJobletКомпонентВыходВходВход
КомпонентыКомпонентыБолее чем 450 доступных компонентов
60% разработаны сообществом пользователей Talend
Доступны в бесплатной версии
Проверены и поддерживаются TalendПринцип организации обмена даннымиМодель хранения данных в операционных системахМодель хранения в CDI-хранилищеТранспортная модельСправочникименКод ИмениКод ОтчестваКод ФамилииДата рожденияСерия ПаспортаНомер ПаспортаКод АдресаИмяФамилияОтчествоДата рожденияПолАдресПаспортИмяОтчествоФамилияДата рожденияПолПаспортАдресСправочник отчествСправочник фамилийСправочник адресовФИОДата рожденияАдресПаспорт
Выборка данных из источниковИнформационная системаТриггерыЗахватизмененийТАБЛИЦА ИЗМЕНЕНИЙТранспортнаямодельКлиентыИзменение 1CDCИзменение 2…CDI…Издательи подписчикОтправкаИзменений(Push)Чтение изменений(Push)Изменение 11…ПодписчикИздательChange Data Capturing (CDC)
Преобразование моделейМодель хранения в информационной системеКомпонентt MapТранспортная модельФИОПетров Петр ПетровичПОЛИМЯПетрДАТА РОЖДЕНИЯРазделение поляОТЧЕСТВОМужскойПетровичПетровФАМИЛИЯ01.01.1980Преобразование форматаПОЛМ01.01.1980ДАТА РОЖДЕНИЯФильтрация данныхДата рождения после 1970г.ФИООтклоненные данные(Дата рождения до 1970 г.)ДАТА РОЖДЕНИЯПОЛ
Преобразование моделейКомпонентt MapТранспортная модельМодель хранения в CDI-хранилищеИМЯКОД ИмениПетр146ФАМИЛИЯКОД  ФамилииПетровОТЧЕСТВОКОД ОтчестваПетровичСправочники CDIИМЯ1ПетрКОДИМЯПЕРЕСЕЧЕНИЕ ДАННЫХЗаписине обнаруженныев справочникахОТЧЕСТВО4ПетровичКОДОТЧЕСТВОФАМИЛИЯ6ПетровКОДФАМИЛИЯ
Работа с данными в MDMЗапись данных в MDMЧтение данных из MDMУдаление данных из MDMПоиск данныхв MDMПолучение измененных данных в MDMПортал (TalendWeb UI)КОННЕКТОРЫСЕРВИСНЫЙ УРОВЕНЬХРАНИЛИЩЕВсего 8 компонентов
“Родословная” данныхCDI ХранилищеИМЯ ОТЧЕСТВОФАМИЛИЯИДЕНТИФИКАТОР10ИвановИвановичИванПерекодировочнаятаблицаИнформационная система 1Идентификатор CDI10ФИОИДЕНТИФИКАТОРИдентификатор UCI100100Иванов Иван Иванович200Идентификатор UC2Информационная система 2ИМЯ ОТЧЕСТВОФАМИЛИЯИДЕНТИФИКАТОР200ИвановИвановичИван
Принцип организации обмена даннымиМодель хранения данных в операционных системахМодель хранения в CDI-хранилищеТранспортная модельСправочникименКод ИмениКод ОтчестваКод ФамилииДата рожденияСерия ПаспортаНомер ПаспортаКод АдресаИмяФамилияОтчествоДата рожденияПолАдресПаспортИмяОтчествоФамилияДата рожденияПолПаспортАдресСправочник отчествСправочник фамилийСправочник адресовФИОДата рожденияАдресПаспорт
ДемонстрацияДемонстрация интеграционных работ:Выборка изменений (СDС)Преобразование данных в транспортный форматРабота с CDI-хранилищем
Принцип организации обмена даннымиМодель хранения данных в операционных системахМодель хранения в CDI-хранилищеТранспортная модельСправочникименКод ИмениКод ОтчестваКод ФамилииДата рожденияСерия ПаспортаНомер ПаспортаКод АдресаИмяФамилияОтчествоДата рожденияПолАдресПаспортИмяОтчествоФамилияДата рожденияПолПаспортАдресСправочник отчествСправочник фамилийСправочник адресовФИОДата рожденияАдресПаспорт
Выборка данных из MDMИзмененные данные в транспортном форматеМодельданныхTalendWeb UIИмяОтчествоФамилияДата рожденияПолПаспортАдресMDM-IDDB-IDХРАНИЛИЩЕИзменение данныхСЕРВИСНЫЙ УРОВЕНЬМЕНЕДЖЕР СОБЫТИЙПроцесс  Шаг 1  Шаг 2  Шаг 3ИнтеграцияКонтроль качестваОповещениеWorkflowТриггер 1Триггер 2Триггер 3Триггер 4Триггер 5Работа TalendТриггеры
ДемонстрацияДемонстрация активной модели данныхАктивная модель данных (триггеры в MDM)Варианты использования триггеров.
Управление справочнойинформациейИнформационная система № 1Информационная система № 2ВЫБОРКА ОБНОВЛЕНИЙВЫБОРКА ОБНОВЛЕНИЙКОНСОЛИДАЦИЯДАННЫЕДАННЫЕПОИСК ДУБЛИКАТОВПОЛЬЗОВАТЕЛЬСЛИЯНИЕЗАГРУЗКА ОБНОВЛЕНИЙЗАГРУЗКА ОБНОВЛЕНИЙОБНОВЛЕНИЕ CDIMDM-CDI ХРАНИЛИЩЕВЫБОРКА ОБНОВЛЕНИЙ
Контроль качества данныхМодель храненияв CDI-хранилищеСправочникименТранспортнаямодельКод ИмениКод ОтчестваКод ФамилииДата рожденияСерия ПаспортаНомер ПаспортаКод АдресаСправочникиСправочник отчествПроверка полноты и корректности данныхПроверка наличия дубликатовЕсли необходимо подключить Data Stewards123ИмяОтчествоФамилияДата рожденияПолПаспортСправочник фамилийСправочник адресов
Проверка корректности данныхНормативно-справочная информацияМодель храненияв CDIКомпонентtRecordMatcherТранспортнаямодельКомпонентtRecordMatcherКод ИмениКод ОтчестваКод ФамилииКод АдресаИмяОтчествоФамилияАдресАдресаКодАдресИменаКодИмяОтчестваКодОтчествоФамилииКодФамилияМасква = Москва
Алгоритм поиска дубликатовКомпонентtRecordМatcherТранспортнаямодельCDI хранилищеИдентифицирующие атрибутыМетодсравненияВесовой коэффициентДистанция====11010Код имениТочно1011212Код отчестваТочно100,89ПетровПитровФамилияЛивенштейн1511234 56789 101234 56789 10ПаспортЛивенштейн20N∑(Дистанция х Весовой коэффициент )Результатсравнения10*1+10*1+0,89*15+20*11РЕЗУЛЬТАТ0,970,97==110+10+15+20Весовой коэффициент∑1Нижний порог0,75<НовыйДубликат>Верхний порог0,95Дубликат
Процесс надзора за даннымиОБНАРУЖЕНИЕ НЕКАЧЕСТВЕННЫХДАННЫХСОЗДАНИЕ ЗАДАЧИ В DSCНАЗНАЧЕНИЕ ЗАДАЧИ В DSCНА ИСПОЛНИТЕЛЯВЫПОЛНЕНИЕ ЗАДАЧИКонсоль надзора за данными (DSC)Data StewardРабота TalendРабота TalendОТПРАВКА ДАННЫХ В СИСТЕМУ ПОЛУЧАТЕЛЬ
Консоль надзора за даннымиНоваяПриоритетСтатусРешенияЗаблокированная(Star)ЗАДАЧАДубликатИсполнительКатегория (Tags)ПолнотаetcДействия выполненные над задачами:  Поиск
  РазделениеПринцип работы консолиОперационная система 1CDIхранилищеРезультатАтрибутыИмяИванИванИванОтчествоИвановичИвновичИвановичФамилияИвановИвoновИвановПаспорт1234 5678911234 5678911234 567891Решение принятоеData StewardИсходные данные
ДемонстрацияДемонстрация работ выполняющих проверку качества данныхДемонстрация консоли надзора за данными (DSC)
Управление справочнойинформациейИнформационная система № 1Информационная система № 2ВЫБОРКА ОБНОВЛЕНИЙВЫБОРКА ОБНОВЛЕНИЙКОНСОЛИДАЦИЯДАННЫЕДАННЫЕПОИСК ДУБЛИКАТОВПОЛЬЗОВАТЕЛЬСЛИЯНИЕЗАГРУЗКА ОБНОВЛЕНИЙЗАГРУЗКА ОБНОВЛЕНИЙОБНОВЛЕНИЕ CDIMDM-CDI ХРАНИЛИЩЕВЫБОРКА ОБНОВЛЕНИЙ
ДемонстрацияДемонстрация сквозного примера:Создание данных в операционных системах.Проверка качества данныхДобавление или редактирование данных в CDI-хранилищеИспользование консоли надзора за даннымиСообщение операционным системам глобального идентификатора
Операционное использование Системы работы с основными даннымиРабота TalendИнформационная системаПроверка качества данныхОтправка клиентских данныхВыполнение процесса надзора за даннымиВеб-портал(Talend Web UI)Сервисы работы с клиентскими даннымиЗагрузка данных в хранилищеПолучение клиентских данныхПотребитель/ПоставщикКонсоль надзора за данными(DSC)Чтение данных из хранилища
Организация сервисного слояРепозитарий работSOA ManagerВеб-Сервис 1Веб-Сервис 2Веб-Сервис 3TalendAdministratorTalendMDM StudioРазработчикАдминистратор
Требования к оборудованиюRAM: > 4 GBHDD: 100 GBRAM: 4 GBHDD: 10 GBTIS StudioTALENDMDM STUDIORAM: 2 GBHDD: 100 GBRAM: 4 GBHDD: 100 GBСервер работRAM: >4 GBHDD: 100 GBTalend  Administration Center (TAC)Talend MDM ServerRAM: 2 GBHDD: 100 GBRAM: 4 GBHDD: 200 GBRAM: 2 GBHDD: 100 GBСервер работМетаданные (TAC)Activity Monitoring Console(журнал выполнения работ)База клиентских данныхМетаданные проектов (SVN)

More Related Content

PDF
JobSchedulerアップデート2016
PDF
ビッグデータ関連Oss動向調査とニーズ分析
PDF
大規模データ分析を支えるインフラ系オープンソースソフトウェアの最新事情
PPTX
Talend Data Quality
PPTX
EmbulkとDigdagとデータ分析基盤と
PPTX
Talend - about company and solutions
PPTX
Microsoft Master Data Services - Master Data Management Tool
PPT
Бизнес переходит в облака
JobSchedulerアップデート2016
ビッグデータ関連Oss動向調査とニーズ分析
大規模データ分析を支えるインフラ系オープンソースソフトウェアの最新事情
Talend Data Quality
EmbulkとDigdagとデータ分析基盤と
Talend - about company and solutions
Microsoft Master Data Services - Master Data Management Tool
Бизнес переходит в облака

Similar to Talend Data Quality - Customer Data Management platform (20)

PPTX
Itransition: Talend - о компании и решениях
PDF
Data Integration Software
PDF
Informatica for Data Warehouse Optimisation and Data Lake Use-cases
PDF
Виртуализация Данных: Введение
PDF
Обеспечение и контроль качества услуг
PPT
BI Pre-Sale
PPT
Инфостарт. Новые возможности 1С 8.3
PPTX
Itransition talend data quality - катализатор адаптации crm
PDF
Открытая сессия по виртуализации данных
PPTX
NAUDOC 365
PDF
Бизнес-контекст, совместная работа и согласованность для интеллектуального уп...
PPTX
IBA RUS: ECM и СЭД - практика применения.
PPTX
Sales man new_v71
PPT
Продукты и решения Informatica
PPTX
3 ibm bdw2015
PPTX
Oracle On Demand General
PPTX
Oracle CRM On Demand
PPTX
IoT: будущее технологии и существующие решения
PDF
Clever data 1dmp_oracle_fors
PDF
управление мастер данными
Itransition: Talend - о компании и решениях
Data Integration Software
Informatica for Data Warehouse Optimisation and Data Lake Use-cases
Виртуализация Данных: Введение
Обеспечение и контроль качества услуг
BI Pre-Sale
Инфостарт. Новые возможности 1С 8.3
Itransition talend data quality - катализатор адаптации crm
Открытая сессия по виртуализации данных
NAUDOC 365
Бизнес-контекст, совместная работа и согласованность для интеллектуального уп...
IBA RUS: ECM и СЭД - практика применения.
Sales man new_v71
Продукты и решения Informatica
3 ibm bdw2015
Oracle On Demand General
Oracle CRM On Demand
IoT: будущее технологии и существующие решения
Clever data 1dmp_oracle_fors
управление мастер данными
Ad

More from Максим Остархов (7)

PDF
Itransition - engineering document management
PDF
SharePoint Collaboration Suite - Collaboration Platform
PPTX
How to find and merge duplicates? (approaches)
PPTX
Customer data management - great tool for increasing sales
PPTX
Talend Data Quality - catalyst for CRM deployment
PDF
Customer Data Management - Marketing best practices
PPTX
Talend Data Quality - catalyst for CRM deployment
Itransition - engineering document management
SharePoint Collaboration Suite - Collaboration Platform
How to find and merge duplicates? (approaches)
Customer data management - great tool for increasing sales
Talend Data Quality - catalyst for CRM deployment
Customer Data Management - Marketing best practices
Talend Data Quality - catalyst for CRM deployment
Ad

Talend Data Quality - Customer Data Management platform

  • 1. Talend Data QualityПлатформа управления клиентскими данными
  • 2. СодержаниеО компаниях Talend и ItransitionОбласти применения платформы решений TalendВарианты использования платформы Talend Data Quality
  • 3. О компании Itransition10 лет на рынке ИТВ штате компании более 600 специалистов№1 по темпам роста в 2009 гг. в РоссииПрестижные премии в сфере бизнеса и ИТСервисный партнер SAPСертифицированный партнер MicrosoftПартнер Rackspace, Broad Vision, NorthGate Arinso, Talend
  • 4. О компании5 лет на мировом рынке ИТПоказатели востребованости продуктов:10 миллионов загрузок за все время существования450 000 пользователей1 500 заказчиков100 новых заказчиков в месяц1 загрузка Talend Open Studio в минуту
  • 5. Области применения решений TalendMDMКачество данныхУправление справочными даннымиПрофилированиеи очисткаданныхИнтеграция данныхФункциональная интеграцияАналитика (ETL)Оперативный обмен данными между информационными системами.Извлечение, преобразование и загрузка данных для систем, обеспечивающих принятие решений
  • 6. Talend Data QualityВарианты использования:Управление справочной информациейОперационное использованиеАналитическое использование
  • 7. Управление справочнойинформациейИнформационная система № 1Информационная система № 2ВЫБОРКА ОБНОВЛЕНИЙВЫБОРКА ОБНОВЛЕНИЙКОНСОЛИДАЦИЯДАННЫЕДАННЫЕПОИСК ДУБЛИКАТОВПОЛЬЗОВАТЕЛЬСЛИЯНИЕЗАГРУЗКА ОБНОВЛЕНИЙЗАГРУЗКА ОБНОВЛЕНИЙОБНОВЛЕНИЕ CDIMDM-CDI ХРАНИЛИЩЕВЫБОРКА ОБНОВЛЕНИЙ
  • 9. Организация доступа к модели данных пользователям
  • 10. Создание механизмов интеграции данных
  • 11. Создание механизмов контроля качества данныхTIS StudioTALENDMDM STUDIOAdministration& MonitoringData StewardshipConsoleTalend Web UIExecution ServerTalend Administration CenterСхема развертыванияTalend MDM ServerExecution ServerAdmin MetadataActivity Monitoring ConsoleМодель и данныеМетаданных проекта
  • 12. Создание моделей данныхИнструмент: Talend MDM StudioВозможности:Проектирование модели данныхУправление представлением данныхФормирование правил контроля качества хранимых данныхОрганизация доступа к данным
  • 13. Модель данныхФизическая область хранения метаданных и данныхБиблиотекатиповФИЗИЧЕСКИЙ АДРЕСЮРИДИЧЕСКИЙ АДРЕСАДРЕС ДОСТАВКИКонтейнер данныхINSURANCEМодель данных INSURANCEПравила проверки данныхТипы данныхБезопасностьАДРЕСИНДЕНТИФИКАЦИОН- НЫЙ ДОКУМЕНТТЕЛЕФОННЫЙНОМЕРПАСПОРТПРАВАМОБИЛЬНЫЙ ТЕЛЕФОНРАБОЧИЙ ТЕЛЕФОНФАКСМодель данныхЛогическая структура описывающая модель основных данных
  • 14. Управление сущностямиПовторное использование (Типизация)СУЩНОСТЬАТРИБУТАННОТАЦИЯАННОТАЦИЯКЛИЕНТНОМЕР ПАСПОРТАПростые типыТипизацияСложные типыВозможностиУправление отображениемУправление доступСвязывание сущностейПроверка вводимых данных
  • 15. Аннотации, управление отображениемУправление сообщениямиоб ошибкахОбязательное полеУправление форматомизображения9 Января 1977 г.1977 – 01 – 09Дата рождения*Место рождения:Управление описаниемполяУправление названиемполяПол: Муж. Жен.Дата рождения клиентафизического лицаДата рождения
  • 16. Аннотации, управление отображениемУправление сообщениямиоб ошибкахMandatory fieldУправление форматомизображения9 Jan 1977 г.1977 – 01 – 09Birthday*Место рождения:Управление описаниемполяУправление названиемполяПол: Муж. Жен.Client birthdayBirthday
  • 17. Аннотации, связывание сущностейТелефонКлиентЗНАЧЕНИЯАТРИБУТЫЗНАЧЕНИЯАТРИБУТЫ10ИДЕНТИФИКАТОР7ТЕЛЕФОННЫЙ КОД СТРАНЫТЕЛЕФОННЫЙНОМЕР10495ТЕЛЕФОНННЫЙ КОД ГОРОДА+758-13-12ТЕЛЕФОННЫЙ НОМЕРМОБИЛЬНЫЙТИП ТЕЛЕФОННОГО НОМЕРАОтображаемое значение7 – 495 – 758 – 13 – 12
  • 18. Аннотации, управление доступомОБЛАСТЬ ВИДИМОСТИКАНАЛ ПРОДАЖДОГОВОРКЛИЕНТТипМенеджерНомерДатаПродуктСуммаИмяОтчествоФамилияПолДата рожденияПаспортТелефонАдресОБЛАСТЬИЗМЕНЕНИЯ
  • 19. Проверка соответствиятребованиям форматасерии паспортаАннотации, контроль вводаКлиент…Проверка соответствиятребованиям форматаномера паспорта112342Паспорт серия:123456Паспорт номер:Проверка наличиязаполненных данныхМосква, ул. Ленина, 12Адрес:me@me.comE-mail:Проверка правильности заполнения E-mail…
  • 21. Базовые ролиРазработка механизмов интеграций данныхРазработка механизмов контроля качества данныхАДМИНИСТРАТОРРазработка модели данныхЛИЦЕНЗИРУЕМАЯ ДЕЯТЕЛЬНОСТЬРабота с основными данными используя APIВНЕШНИЕ СИСТЕМЫПОЛЬЗОВАТЕЛЬРабота с данными через порталПОЛЬЗОВАТЕЛЬ ПОРТАЛАПросмотр данных через портал
  • 22. ДемонстрацияВозможности Talend MDM Studio по работе с моделями данных:СущностиАтрибутыАннотацииРоли
  • 23. Организация доступа к даннымиИнструмент: Talend Web UI (портал)Возможности:Создание, редактирование, удаление клиентских данныхРабота с иерархиями записейо клиентахУправление пользователями
  • 24. ПредставленияАтрибуты, входящие в результаты поискаТелефонСегментКонтактное лицоФ.И.О.Ограничение набора доступных записейСидоров С.С.ОСАГО+7 916 4008031Иванов И.И.Смирнов И.И.ОСАГОПетров П.П.+7 916 8004031Петров П.П.+7 916 3104080КАСКОСидоров И.И.Иванов И.И.Смирнов С.С.ДМС+7 916 8104031Атрибуты,входящие в условия поиска
  • 25. Иерархии, группировкиФизические лицаФ.И.О.СегментОСАГОДМСКАСКОИванов Иван ИвановичПетров Петр ПетровичСмирнов Иван ИвановичИванов ИванИвановичОСАГОСидоров Сергей СергеевичПетров Петр ПетровичДМССмирнов Иван ИвановичКАСКОСидоров Сергей СергеевичОСАГО
  • 26. Иерархии, взаимосвязиФизические лицаИванов И.И.Ф.И.О.Контактное лицоСидоров С.С.Иванов И.И.Сидоров С.С.Иванов И.И.Петров П.П.Смирнов И.И.Петров П.П.Смирнов И.И.Смирнов И.И.Петров П.П.Сидоров И.И.Петров П.П.Сидоров С.С.Иванов И.И.Смирнов С.С.Иванов И.И.Сидоров С.С.
  • 28. ДемонстрацияДемонстрация Talend MDM Studio:Работа с представлениямиДемонстрация портала по работе с клиентскими данными Web UI:Просмотр данныхИерархииПользователи
  • 29. Управление справочнойинформациейИнформационная система № 1Информационная система № 2ВЫБОРКА ОБНОВЛЕНИЙВЫБОРКА ОБНОВЛЕНИЙКОНСОЛИДАЦИЯДАННЫЕДАННЫЕПОИСК ДУБЛИКАТОВПОЛЬЗОВАТЕЛЬСЛИЯНИЕЗАГРУЗКА ОБНОВЛЕНИЙЗАГРУЗКА ОБНОВЛЕНИЙОБНОВЛЕНИЕ CDIMDM-CDI ХРАНИЛИЩЕВЫБОРКА ОБНОВЛЕНИЙ
  • 30. Создание механизмов интеграции данныхИнструмент: Talend MDM StudioВозможности:Разработка механизмов выборки данных из операционных системРазработка механизмов трансформации данныхРазработка механизмов загрузки данных в MDM-CDI хранилище
  • 31. Механизмы интеграции и контроля качестваРабота TalendРаботаКомпонентКомпонентJobletКомпонентВыходВходВход
  • 32. КомпонентыКомпонентыБолее чем 450 доступных компонентов
  • 33. 60% разработаны сообществом пользователей Talend
  • 35. Проверены и поддерживаются TalendПринцип организации обмена даннымиМодель хранения данных в операционных системахМодель хранения в CDI-хранилищеТранспортная модельСправочникименКод ИмениКод ОтчестваКод ФамилииДата рожденияСерия ПаспортаНомер ПаспортаКод АдресаИмяФамилияОтчествоДата рожденияПолАдресПаспортИмяОтчествоФамилияДата рожденияПолПаспортАдресСправочник отчествСправочник фамилийСправочник адресовФИОДата рожденияАдресПаспорт
  • 36. Выборка данных из источниковИнформационная системаТриггерыЗахватизмененийТАБЛИЦА ИЗМЕНЕНИЙТранспортнаямодельКлиентыИзменение 1CDCИзменение 2…CDI…Издательи подписчикОтправкаИзменений(Push)Чтение изменений(Push)Изменение 11…ПодписчикИздательChange Data Capturing (CDC)
  • 37. Преобразование моделейМодель хранения в информационной системеКомпонентt MapТранспортная модельФИОПетров Петр ПетровичПОЛИМЯПетрДАТА РОЖДЕНИЯРазделение поляОТЧЕСТВОМужскойПетровичПетровФАМИЛИЯ01.01.1980Преобразование форматаПОЛМ01.01.1980ДАТА РОЖДЕНИЯФильтрация данныхДата рождения после 1970г.ФИООтклоненные данные(Дата рождения до 1970 г.)ДАТА РОЖДЕНИЯПОЛ
  • 38. Преобразование моделейКомпонентt MapТранспортная модельМодель хранения в CDI-хранилищеИМЯКОД ИмениПетр146ФАМИЛИЯКОД ФамилииПетровОТЧЕСТВОКОД ОтчестваПетровичСправочники CDIИМЯ1ПетрКОДИМЯПЕРЕСЕЧЕНИЕ ДАННЫХЗаписине обнаруженныев справочникахОТЧЕСТВО4ПетровичКОДОТЧЕСТВОФАМИЛИЯ6ПетровКОДФАМИЛИЯ
  • 39. Работа с данными в MDMЗапись данных в MDMЧтение данных из MDMУдаление данных из MDMПоиск данныхв MDMПолучение измененных данных в MDMПортал (TalendWeb UI)КОННЕКТОРЫСЕРВИСНЫЙ УРОВЕНЬХРАНИЛИЩЕВсего 8 компонентов
  • 40. “Родословная” данныхCDI ХранилищеИМЯ ОТЧЕСТВОФАМИЛИЯИДЕНТИФИКАТОР10ИвановИвановичИванПерекодировочнаятаблицаИнформационная система 1Идентификатор CDI10ФИОИДЕНТИФИКАТОРИдентификатор UCI100100Иванов Иван Иванович200Идентификатор UC2Информационная система 2ИМЯ ОТЧЕСТВОФАМИЛИЯИДЕНТИФИКАТОР200ИвановИвановичИван
  • 41. Принцип организации обмена даннымиМодель хранения данных в операционных системахМодель хранения в CDI-хранилищеТранспортная модельСправочникименКод ИмениКод ОтчестваКод ФамилииДата рожденияСерия ПаспортаНомер ПаспортаКод АдресаИмяФамилияОтчествоДата рожденияПолАдресПаспортИмяОтчествоФамилияДата рожденияПолПаспортАдресСправочник отчествСправочник фамилийСправочник адресовФИОДата рожденияАдресПаспорт
  • 42. ДемонстрацияДемонстрация интеграционных работ:Выборка изменений (СDС)Преобразование данных в транспортный форматРабота с CDI-хранилищем
  • 43. Принцип организации обмена даннымиМодель хранения данных в операционных системахМодель хранения в CDI-хранилищеТранспортная модельСправочникименКод ИмениКод ОтчестваКод ФамилииДата рожденияСерия ПаспортаНомер ПаспортаКод АдресаИмяФамилияОтчествоДата рожденияПолАдресПаспортИмяОтчествоФамилияДата рожденияПолПаспортАдресСправочник отчествСправочник фамилийСправочник адресовФИОДата рожденияАдресПаспорт
  • 44. Выборка данных из MDMИзмененные данные в транспортном форматеМодельданныхTalendWeb UIИмяОтчествоФамилияДата рожденияПолПаспортАдресMDM-IDDB-IDХРАНИЛИЩЕИзменение данныхСЕРВИСНЫЙ УРОВЕНЬМЕНЕДЖЕР СОБЫТИЙПроцесс Шаг 1 Шаг 2 Шаг 3ИнтеграцияКонтроль качестваОповещениеWorkflowТриггер 1Триггер 2Триггер 3Триггер 4Триггер 5Работа TalendТриггеры
  • 45. ДемонстрацияДемонстрация активной модели данныхАктивная модель данных (триггеры в MDM)Варианты использования триггеров.
  • 46. Управление справочнойинформациейИнформационная система № 1Информационная система № 2ВЫБОРКА ОБНОВЛЕНИЙВЫБОРКА ОБНОВЛЕНИЙКОНСОЛИДАЦИЯДАННЫЕДАННЫЕПОИСК ДУБЛИКАТОВПОЛЬЗОВАТЕЛЬСЛИЯНИЕЗАГРУЗКА ОБНОВЛЕНИЙЗАГРУЗКА ОБНОВЛЕНИЙОБНОВЛЕНИЕ CDIMDM-CDI ХРАНИЛИЩЕВЫБОРКА ОБНОВЛЕНИЙ
  • 47. Контроль качества данныхМодель храненияв CDI-хранилищеСправочникименТранспортнаямодельКод ИмениКод ОтчестваКод ФамилииДата рожденияСерия ПаспортаНомер ПаспортаКод АдресаСправочникиСправочник отчествПроверка полноты и корректности данныхПроверка наличия дубликатовЕсли необходимо подключить Data Stewards123ИмяОтчествоФамилияДата рожденияПолПаспортСправочник фамилийСправочник адресов
  • 48. Проверка корректности данныхНормативно-справочная информацияМодель храненияв CDIКомпонентtRecordMatcherТранспортнаямодельКомпонентtRecordMatcherКод ИмениКод ОтчестваКод ФамилииКод АдресаИмяОтчествоФамилияАдресАдресаКодАдресИменаКодИмяОтчестваКодОтчествоФамилииКодФамилияМасква = Москва
  • 49. Алгоритм поиска дубликатовКомпонентtRecordМatcherТранспортнаямодельCDI хранилищеИдентифицирующие атрибутыМетодсравненияВесовой коэффициентДистанция====11010Код имениТочно1011212Код отчестваТочно100,89ПетровПитровФамилияЛивенштейн1511234 56789 101234 56789 10ПаспортЛивенштейн20N∑(Дистанция х Весовой коэффициент )Результатсравнения10*1+10*1+0,89*15+20*11РЕЗУЛЬТАТ0,970,97==110+10+15+20Весовой коэффициент∑1Нижний порог0,75<НовыйДубликат>Верхний порог0,95Дубликат
  • 50. Процесс надзора за даннымиОБНАРУЖЕНИЕ НЕКАЧЕСТВЕННЫХДАННЫХСОЗДАНИЕ ЗАДАЧИ В DSCНАЗНАЧЕНИЕ ЗАДАЧИ В DSCНА ИСПОЛНИТЕЛЯВЫПОЛНЕНИЕ ЗАДАЧИКонсоль надзора за данными (DSC)Data StewardРабота TalendРабота TalendОТПРАВКА ДАННЫХ В СИСТЕМУ ПОЛУЧАТЕЛЬ
  • 51. Консоль надзора за даннымиНоваяПриоритетСтатусРешенияЗаблокированная(Star)ЗАДАЧАДубликатИсполнительКатегория (Tags)ПолнотаetcДействия выполненные над задачами: Поиск
  • 52. РазделениеПринцип работы консолиОперационная система 1CDIхранилищеРезультатАтрибутыИмяИванИванИванОтчествоИвановичИвновичИвановичФамилияИвановИвoновИвановПаспорт1234 5678911234 5678911234 567891Решение принятоеData StewardИсходные данные
  • 53. ДемонстрацияДемонстрация работ выполняющих проверку качества данныхДемонстрация консоли надзора за данными (DSC)
  • 54. Управление справочнойинформациейИнформационная система № 1Информационная система № 2ВЫБОРКА ОБНОВЛЕНИЙВЫБОРКА ОБНОВЛЕНИЙКОНСОЛИДАЦИЯДАННЫЕДАННЫЕПОИСК ДУБЛИКАТОВПОЛЬЗОВАТЕЛЬСЛИЯНИЕЗАГРУЗКА ОБНОВЛЕНИЙЗАГРУЗКА ОБНОВЛЕНИЙОБНОВЛЕНИЕ CDIMDM-CDI ХРАНИЛИЩЕВЫБОРКА ОБНОВЛЕНИЙ
  • 55. ДемонстрацияДемонстрация сквозного примера:Создание данных в операционных системах.Проверка качества данныхДобавление или редактирование данных в CDI-хранилищеИспользование консоли надзора за даннымиСообщение операционным системам глобального идентификатора
  • 56. Операционное использование Системы работы с основными даннымиРабота TalendИнформационная системаПроверка качества данныхОтправка клиентских данныхВыполнение процесса надзора за даннымиВеб-портал(Talend Web UI)Сервисы работы с клиентскими даннымиЗагрузка данных в хранилищеПолучение клиентских данныхПотребитель/ПоставщикКонсоль надзора за данными(DSC)Чтение данных из хранилища
  • 57. Организация сервисного слояРепозитарий работSOA ManagerВеб-Сервис 1Веб-Сервис 2Веб-Сервис 3TalendAdministratorTalendMDM StudioРазработчикАдминистратор
  • 58. Требования к оборудованиюRAM: > 4 GBHDD: 100 GBRAM: 4 GBHDD: 10 GBTIS StudioTALENDMDM STUDIORAM: 2 GBHDD: 100 GBRAM: 4 GBHDD: 100 GBСервер работRAM: >4 GBHDD: 100 GBTalend Administration Center (TAC)Talend MDM ServerRAM: 2 GBHDD: 100 GBRAM: 4 GBHDD: 200 GBRAM: 2 GBHDD: 100 GBСервер работМетаданные (TAC)Activity Monitoring Console(журнал выполнения работ)База клиентских данныхМетаданные проектов (SVN)
  • 59. Варианты поддержки решенияGoldSupportSilverSupportPlatinumSupportДоступ к сертифицированной версииАвтоматическое обновлениеДоступ к системе отслеживания ошибокПоддержка на форумеГарантированное время ответаГарантированное время диагностикиНеограниченное количество обращений по проблемамWeb поддержкаEmail поддержкаПоддержка по телефону24-часовая поддержка
  • 60. Заказчики TalendФинансы и страхованиеУслугиПроизводство и торговляГосударственный сектор и образование
  • 61. За кадром!Разработка и управление процессами изменения клиентских данных (workflow)Версионость клиентских данныхСинхронизация данных между несколькими хранилищами клиентских данныхПрофилирование данныхПрофилирование исполнения работ
  • 62. Спасибо за внимание!Максим ОСТАРХОВДиректор по развитию бизнеса в СНГТел.: +7 495 641 0206Моб.: + 7 915 400 8031E-mail: m.ostarhov@itransition.comWeb: www.itransition.com