Demo Deduplikacji

Deduplikacja polega na rozpoznaniu różnych form zapisu tego samego elementu rozproszonego po bazie danych.

Najczęściej deduplikujemy listy klientów, firm i adresów. W ten sam sposób możemy jednak podejść do wykazów nazw produktów (SKU), marek samochodów.

Wpisz własne wierszu u dołu tabeli i uruchom testową deduplikację. Jeśli wprowadzony rekord połączy się z którymś ze wzorców, zostanie oznaczony odpowiednim kolorem w tabeli wynikowej. Zobaczysz też jakie grupy utworzyły wcześniej przygotowane wpisy.

Id
Kod pocztowy
Miasto
Ulica
Nr
Nazwa firmy
NIP
1
Łódź
Piotrkowska 241
Bank inwestycyjny
521-34-96-631
2
WARSZAWA
MARSZALKOWSKA 26
FHU DEDUPLIKATOR
3
62020
Swarzędz
Meblowa
30
Firma Usługowa Mebel
111-111-11-11
4
00-576
m.st.Warszawa
ul. Marszałkowska
24/26
Firma Handlowo Przemysłowa Deduplikator SA
123-456-78-90
5
62-020 Swarzędz
SKLEP "MEBEL" JAN KOWALSKI I SYN
6
Kraków
3 Maja
15
JADŁODAJNIA
526-02-50-475
7
Łódź
Piotrkowska 50
Bank inwestycyjny
521-349-66-31
8
Gdańsk
Stanislawa Lema 2
Pośrednictwo finansowe
5213496631
9
Kraków
al. 3-go Maja 15
BAR
5260250475
10
Gdańsk
Lema
2
Best-Finance Kowalski Jan
52-13-496-631
Wypełnij pola:


Często zadawane pytania (FAQ)

Co to jest deduplikacja?
Deduplikacja danych jest czynnością polegającą na znalezieniu takich samych rekordów pomimo różnic, błędów i literówek w zapisie.

Skąd się biorą duplikaty?
Duplikaty najczęściej powstają przy łączeniu różnych baz danych oraz przy ręcznym wprowadzaniu danych, na skutek błędów i "literówek". W bazach, które nigdy nie były deduplikowane odsetek powtórzeń może sięgać nawet kilkunastu % procent.

Czy deduplikować można tylko dane adresowe?
Deduplikować można dane każdego rodzaju, np. dane adresowe, słowniki nazw, kody i nazewnictwo towarów oraz wszelkie inne bazy danych, w których proces wprowadzania danych był słabo kontrolowany.

Czy deduplikacja jest procesem jednoznacznym?
Deduplikacja jest zależna od ustawień konfiguracyjnych, które w zależności od rodzaju danych oraz celu (znajdywanie połączeń, wykluczanie powtórzeń) można odpowiednio przygotować i w rezultacie otrzymać najlepszy wynik. Deduplikacja jest także skalowalna, co oznacza iż jej kryteria mogą być bardziej lub mniej liberalne.

Dlaczego warto wykonywać deduplikację?
Deduplikacja danych to oszczędność i poprawa wizerunku oraz jakości. Przykładowo, posiadając bazę adresową potencjalnych klientów, w momencie chęci skontaktowania się z jej członkami listownie, biorąc pod uwagę sam koszt znaczka pocztowego i perspektywę jednorazowej wysyłki, deduplikacja opłaca się, jeżeli w bazie zostanie zidentyfikowanych już 2% powtarzających się rekordów.

Gdzie i kiedy stosuje się deduplikację?
- w celu wzbogacenia danych (uzupełnienia danych w bazie danymi z innej bazy)
- w systemach CRM, gdy powtarzające się dane komplikują pracę działu handlowego
- w celu wyeliminowania powtarzających się rekordów przed kontaktem z członkami bazy
- przy łączeniu kilku baz danych w jedną bazę

W jaki sposób DataWise wykonuje deduplikację?
DataWise dysponuje autorskim oprogramowaniem do deduplikacji, które działa w architekturze klient-serwer. Serwer usługi jest zintegrowany z narzędziami do standaryzacji i normalizacji danych wejściowych. Całe środowisko może być skonfigurowane w obrębie sieci LAN klienta lub udostępnione poprzez API. Proces deduplikacji może być też wykonany w trybie wsadowym przez DataWise.

Czy reguły deduplikacji są konfigurowalne?
Tak.

Co jest wynikiem deduplikacji (np. bazy firm)?
Jako wynik procesu zwracane są rekordy wejściowe wraz z wystandaryzowanymi polami, które wpływają na proced deduplikacji. Rekordy zaklasyfikowane jako duplikaty mają przypisany wspólny identyfikator.

Czy muszę coś zmieniać w swojej bazie danych aby wykonać deduplikację i wykorzystać jej wynik?
Nie

Co zrobić, żeby zacząć?
Skontaktuj się znami!

Projekt stworzony przez: