Введение в аналитику больших массивов данных | ointuit.ru

Введение в аналитику больших массивов данных

Ответы на курс: Введение в аналитику больших массивов данных

Hadoop – это:

Объём накопленных человечеством цифровых данных на 2012 год измеряется:

Какие из следующих технологий СУБД не используют принцип MapReduce

Какие вероятные разочарования тренда больших данных?

Отметьте те из вариантов, в которых данные структурированы:

Вы являетесь владельцем и аналитиком в компании из 10 человек, в которой требуется проанализировать продажи за 1 год (1 млн. продаж). Какие из этапов CRISP-DM можно опустить:

Выберите одно неверное высказывание про MapReduce:

Выберите верное утверждение:

большинство данных в мире в 2011 году содержалось:

Выберите неверное высказывание:

Выберите верный ответ

В чём преимущество колоночно-ориентированных СУБД?

Пример благоразумного использования Hadoop

Какие из следующих средств разумно использовать для анализа данных, представленных единственным csv-файлом размера более 100Гб:

Ниже приведена последовательность этапов проекта аналитики в соответствии с CRISP-DM, укажите первый этап.

Отметьте значимые события, повлиявшие на формирование тренда больших данных:

Компания, проводящая социологические опросы получает анкеты от волонтеров, непосредственно опрашивающих респондентов. При каких условиях разумна постановка задачи цензурирования?

С некоторой периодичностью персонал предприятия списывает группы расходных материалов на различных участках учета. Для выявления ошибок, акты списания выборочно проверяются аудитором. Руководство компании заинтересовано в сокращении количества проверок, при сохранении точности выявления ошибочного списания на уровне 97%. Требуется выявлять сомнительные акты списания, подлежащие обязательной проверке аудитором. К какому типу относится эта задача анализа данных?

Кардиологический центр исследовал возможность прогнозирования возникновения осложнений во время операционного вмешательства по до-операционным данным о пациенте: результатам физиологического и диагностического обследований. К какому типу задача анализа данных относится задача прогнозирования операционных осложнений?

К какому типу шкал относится шкала «очень плохо»-«плохо»-«средне»-«хорошо-«очень хорошо»?

Какая типизация в языке R?

Есть таблица со столбцами x, id, y, price.
Выразите зависимость price от x,y?

На основе какого языка был создан R?

Присваивание в R нельзя осуществить с помощью оператора:

Как правильно присвоить p значение типа данных, имеющих две координаты x=1 и y=2?

Есть таблица со столбцами x, id, y, price.
Что означает запись price~.-id?

Является ли ошибкой использование такой записи: x.x=1?

Операция с диапазонами
x=1:3
y=4:6

Чему будет равно x+y?


Каким образом можно описать вектор (1,2,3,4,5,6)?

Что вернет следующее выражение sum(1:3>2)?

p.x=1.y=2
Что выведет print(p)?

Как сделать вектор из трех чисел?

Для каких аргументов функция is.finite вернет true?

R является:

Какой результат будет у функции is.finite(Inf-Inf)?

Каким будет округленный результат прогнозирования пустого значения в таблице с помощью функции ТЕНДЕНЦИЯ:

Год 1 2 3 4
Тыс. руб 67 120 160

Основной целью процесса на приведенной диаграмме является

Что будет присвоено переменной res (Python) в следующем выражении res = [x for x in xrange(1,5, 2)]

Каково ограничение в Excel 2013 на количество строк при загрузке csv-файла?

Есть список на Python s = [1, 2, 3, 4, 6], что вернет выражение s[2:-2]

Существуют ли встроенные ограничения в Excel 2013 на количество элементов данных в одном ряду данных для плоских диаграмм?

Какие из перечисленных признаков таблицы могут быть классификационными без предварительной обработки?


Что выведет в приведённой схеме TextViewer?


Назовите преимущества R, как инструмента data mining, перед другими языками

Основное преимущество Python перед R – это

Имеет ли Python аналог Data Frame из R

Необходимо провести предварительный анализ данных для их лучшего понимания, выберите наиболее подходящие инструменты

Можно ли с помощью приведённой схемы произвести оценку качества работы алгоритма J48 на загруженных данных?


Какой из языков наиболее богат библиотеками/фреймворками для интерактивной визуализации данных

Необходимо реализовать решение по анализу данных и передать его стороннему заказчику в эксплуатацию, выберите наиболее подходящие инструменты

Какие из перечисленных признаков таблицы представлены в абсолютной шкале?


Чего не могут стандартные реляционные базы (MySQL, Oracle, MS SQL)?

В чём состоит свойство расширяемости записей СУБД?

Перечислите основные свойства графовых БД

Какие типы СУБД поддерживают одновременно высокую-доступность, консистентность и распределённость?

В социальной сети пользователи пишут друг другу сообщения, какие данные логично хранить в графовой СУБД?

Какие характеристики объединяют СУБД Hbase и BigTable

В каких из приведённых примеров наиболее эффективны NoSQL решения типа ключ-значение?

Отметьте причины создания NoSQL баз данных:

Какая из приведённых функций реализует алгоритм классификации

Какая из следующих СУБД подходит для организации высоко-доступного и консистентного хранилища?

Почему Hbase не подходит для большинства веб-приложений с высокой посещаемостью?

Отметьте те характеристики, которые объединяют СУБД Redis и CouchDB

Отметьте неверное понимание Variety в контексте характеристик Big Data:

Клиент покупает билет на самолет через интернет. Как бы в данном случае формулировалась задача прогнозирования?

Необходимо реализовать интерактивную визуализацию данных, которая будет доступна широкому кругу людей, выберите наиболее подходящие инструменты

Какой тип NoSQL решения наиболее эффективен для потоковой обработки логов кластера серверов и быстрого сохранения без требования оперативной аналитики?

Какие из следующих шкал в точности являются порядковыми?

Начиная с каких размеров данных обоснованно применение кластера Hadoop для хранения данных?

Клиент покупает билет на самолет через интернет. В момент покупки, он хочет знать насколько может упасть стоимость этого билета в ближайшем будущем и когда. К какому типу относится эта задача анализа данных?

Инвестиционный фонд интересуется тем, почему часть финансируемых им
проектов успешно переходят на второй год, а часть — нет. К какому типу относится эта задача анализа данных?

Comments are closed.


Яндекс.Метрика