Нечітке зіставлення даних у SQL. Джим Лемер
- Артикул: BC-080027
- Наявність: Є в наявності
Практики, методики та прийоми, які допоможуть вам виявляти та видаляти дублікати
Ви отримали два різні, але пов'язані між собою набори даних? Що робити? Які інструменти використовувати для пошуку збігів? А якщо все, що у вас є, - це доступ до бази даних за допомогою запиту SQL SELECT? Джим Лемер познайомить вас із найкращими практиками, техніками та хитрими прийомами, що допоможуть імпортувати, очищати, зіставляти, оцінювати й осмислювати різнорідні дані за допомогою SQL.
Адміністратори баз даних, розробники, бізнес-аналітики та фахівці data science дізнаються, як виявляти й видаляти дублікати, парсити рядки, витягувати дані з XML і JSON, упорядковувати дані, а також працювати над якістю даних і виконувати операції ETL для пошуку схожості та відмінності між різними уявленнями однакових даних.
Приклади в книзі містять реальні кейси та робочий код.
5 причин прочитати:
- Ви дізнаєтеся, як знаходити і видаляти дублікати в різних наборах даних за допомогою SQL.
- Навчитеся нормалізувати дані та підвищувати їхню якість за допомогою SQL.
- Будете генерувати SQL за допомогою SQL для підвищення продуктивності.
- Зможете готувати набори даних для імпорту, об'єднання та кращого аналізу за допомогою SQL.
- Підвищите якість даних і навчитеся виконувати операції ETL для пошуку подібностей і відмінностей між різними уявленнями однакових даних.
Інформація про книгу | |
Автор | Джим Лемер |
Обкладинка | М'яка |
Кількість сторінок | 288 |
Мова видання | Російська |
Ілюстрації | Чорно-білі |
Рік видання | 2024 |