Ответы на курс: Введение в аналитику больших массивов данных
Hadoop – это:
Объём накопленных человечеством цифровых данных на 2012 год измеряется:
Какие из следующих технологий СУБД не используют принцип MapReduce
Какие вероятные разочарования тренда больших данных?
Отметьте те из вариантов, в которых данные структурированы:
Вы являетесь владельцем и аналитиком в компании из 10 человек, в которой требуется проанализировать продажи за 1 год (1 млн. продаж). Какие из этапов CRISP-DM можно опустить:
Выберите одно неверное высказывание про MapReduce:
Выберите верное утверждение:
большинство данных в мире в 2011 году содержалось:
Выберите неверное высказывание:
Выберите верный ответ
В чём преимущество колоночно-ориентированных СУБД?
Пример благоразумного использования Hadoop
Какие из следующих средств разумно использовать для анализа данных, представленных единственным csv-файлом размера более 100Гб:
Ниже приведена последовательность этапов проекта аналитики в соответствии с CRISP-DM, укажите первый этап.
Отметьте значимые события, повлиявшие на формирование тренда больших данных:
Компания, проводящая социологические опросы получает анкеты от волонтеров, непосредственно опрашивающих респондентов. При каких условиях разумна постановка задачи цензурирования?
С некоторой периодичностью персонал предприятия списывает группы расходных материалов на различных участках учета. Для выявления ошибок, акты списания выборочно проверяются аудитором. Руководство компании заинтересовано в сокращении количества проверок, при сохранении точности выявления ошибочного списания на уровне 97%. Требуется выявлять сомнительные акты списания, подлежащие обязательной проверке аудитором. К какому типу относится эта задача анализа данных?
Кардиологический центр исследовал возможность прогнозирования возникновения осложнений во время операционного вмешательства по до-операционным данным о пациенте: результатам физиологического и диагностического обследований. К какому типу задача анализа данных относится задача прогнозирования операционных осложнений?
К какому типу шкал относится шкала «очень плохо»-«плохо»-«средне»-«хорошо-«очень хорошо»?
Какая типизация в языке R?
Есть таблица со столбцами x, id, y, price.
Выразите зависимость price от x,y?
На основе какого языка был создан R?
Присваивание в R нельзя осуществить с помощью оператора:
Как правильно присвоить p значение типа данных, имеющих две координаты x=1 и y=2?
Есть таблица со столбцами x, id, y, price.
Что означает запись
?
Является ли ошибкой использование такой записи: x.x=1?
Операция с диапазонами
x=1:3 y=4:6
Чему будет равно x+y?
Каким образом можно описать вектор (1,2,3,4,5,6)?
Что вернет следующее выражение sum(1:3>2)?
p.x=1.y=2
Что выведет print(p)?
Как сделать вектор из трех чисел?
Для каких аргументов функция is.finite вернет true?
R является:
Какой результат будет у функции is.finite(Inf-Inf)?
Каким будет округленный результат прогнозирования пустого значения в таблице с помощью функции ТЕНДЕНЦИЯ:
| Год | 1 | 2 | 3 | 4 |
| Тыс. руб | 67 | 120 | 160 |



