500₴
Практический курс по Big Data 2023. Все части Алексей Драль
500₴
Характеристики товара:
| Состояние | Новое |
| Для | взрослых |
| Вид | Курс, Лекции |
| Язык | Русский |
Доставка: как указано в объявлении | Одесса | Наложенного платежа нет | Возврат: в течение 14 дней, при сохранении упаковки (обратную отправку оплачивает покупатель) | Актуально на: 28 апреля 2026
Информация о продавце
Premium магазин
"Электронные книги, курсы, марафоны и многое другое"
Premium магазин
"Электронные книги, курсы, марафоны и многое другое"
Регистрация: 24.02.2012
Заходил(а): 29.04.2026 (21:27)
Заходил(а): 29.04.2026 (21:27)
Откуда: Одесса
Разделы Premium магазина:
Подробное описание: Практический курс по Big Data 2023. Все части Алексей Драль
Практический курс по Big Data 2023. Все части (Алексей Драль)?Записи готового материала.
?Отправляю на почту для скачивания(можно смотреть онлайн по моей ссылочке)
?Доступ постоянный!
?Цена -500грн
Вы научитесь работать с распределенными файловыми системами, познакомитесь с экосистемой Hadoop, разберетесь с оптимизацией MapReduce
вычислений и работой с Hive.
Часть 1. HDFS, Map Reduce, Hive
В этом модуле вы изучите:
вводная часть: знакомство (задачи, оценки, дедлайны), подробности курса;
распределенные файловые системы (GFS, HDFS). Их составляющие, достоинства, недостатки и сфера применения;
чтение и запись в HDFS. HDFS APIs: Web, shell.
Hadoop Streaming;
элементы Hadoop-задачи (Mapper, reducer, combiner, partitioner, comparator).
приложения с несколькими Hadoop-задачами;
тюнинг Hadoop-job (настройка партиционирования, сложные ключи, uber jobs);
задачи с несколькими входами. Joins в Hadoop.
архитектура Hive, виды таблиц, форматы хранения данных;
трансляция Hive-запросов в MapReduce-задачи;
сериализация и десериализация;
тюнинг Join´ов в Hive;
партиционирование, бакетирование, семплирование;
User defined functions, Hive Streaming.
Часть 2. Spark: from zero to hero
На протяжении этой части курса вы будете работать со Spark: от основных
терминов и RDD до Spark DataFrames и оптимизации Spark вычислений.
В этом модуле вы изучите:
cхема выполнения задачи в Spark;
основные термины Spark (job, task, stage);
представление вычислений в виде графа. Spark Python API. Spark RDD API;
Broadcast-сообщения и счетчики.
взаимодействие Hive и Spark SQL;
отличия DF от RDD.
Spark on YARN;
типы stage в Spark;
оптимизация операции shuffle;
настройка Garbage Collection, тюнинг потребления памяти.
Часть 3. RT, NoSQL, Data layout, Kafka
В этом модуле вы изучите:
подходы к Realtime-обработке;
гарантии обработки, переход от одной гарантии к другой, архитектуры "Лямбда" и "Каппа";
Spark Streaming vs. Spark RDD, Spark Structured Streaming vs. Spark DataFrames, DStream;
архитектура Kafka, Kafka Streams, репликация в Kafka. Отличие Kafka от классических очередей;
семантики доставки сообщений, сжатие данных в Kafka, синхронная и асинхронная репликация.
отличия Key-Value хранилищ от реляционных БД;
компактификация и её виды, CQLSH;
архитектура Cassandra;
обеспечение надёжности и высокодоступности в Key-Value хранилищах;
интеграция Spark с Cassandra.
как бороться с Data Skew с помощью MapReduce подходов в разных фреймворках;
trade-off между CPU и IO-bound приложениями, подходы к сжатию в Big Data, горячие и холодные данные;
форматы данных в Big Data: ORC vs Parquet, Avro, ...
?Для заказа пишите сюда или вайбер ? 0938820793.
?Принимаю заказы на любые тренинги ,курсы, вебинары ,книги в электронном виде
?Смотрите все мои объявления тут:
?https://www.kidstaff.com.ua/user-anno-274202













