Источник данных Орыс тілінде қолдану мысалдары және олардың Қазақ тіліне аудармалары
{-}
Источник данных.
Очистить источник данных.
Источник данных Тип.
Очистить источник данных.
Источник данных для формы:"% 1".
Адамдар да аударады
Очистить источник данных.
Источник данных исполняемых объектовName.
Невозможно связать виджет и источник данных.
Источник данных значков веб- сайтовName.
Таблица 2. 8. Исследования, в которых используется большой источник данных для прогнозирования некоторых событий.
Firsts/ 2: 1s награжден( 100)- процент студентов, которые закончили университет с или новинок 2: 1 степени;несекретные градусов исключены( источник данных: hesam); а также.
Исследование качества( 200)- на основе самых последних исследований по оценке упражнения( источник данных: Совет по финансированию высших образования в Англии( HEFCE));
A- уровня/ Высшие точки( 250)- на национальном уровне проверенные данные для последующего учебного года используются для расчета турнирной таблицы( источник данных: hesam);
Уровень отчисления(+ 57 в- 74 точки)- количество студентов, которые бросают до завершения их курсов по сравнению с числом, как ожидается, сделать это( контрольный показатель показаны в скобках)( источник данных: HEFCE, Показатели результативности в области высшего образования).
Удовлетворение Student(+ 50 в- 55 точки)- результаты национальных опросов студентов оцениваются принимая теоретический минимальный и максимальный балл 50% атакже 90% соответственно( источник данных: Национальное обследование Студент);
Рисунок 2. 1: Оценки шансов ребенка на достижение 20% распределения доходов, при условии, что родители в нижней части 20%( Chetty et al. 2014). Оценки регионального уровня, которые показывают неоднородность, естественно, приводят к интересным и важным вопросам, которые не связаны с единой оценкой на национальном уровне. Эти оценки на региональном уровне стали возможными отчасти потому,что исследователи использовали большой большой источник данных: налоговые отчеты 40 миллионов человек. Создано из данных, доступных по адресу http:// www. equality- of- opportunity. org/.
Ошибка системы IBM 126 при создании источника данных ODBC.
Что желаемые характеристики источника данных зависят от цели исследования, я считаю, что полезно грубо группировать десять характеристик по двум широким категориям.
Другой способ, с помощью которого исследователи могут использовать большие источники данных в исследовательских исследованиях,- это выборка для людей с определенными характеристиками. К сожалению, этот подход может вызвать вопросы, связанные с уединением( Beskow, Sandler, and Weinberger 2006).
Таблица 2. 3: Примеры природных экспериментов с использованием больших источников данных. Все эти исследования следуют той же основной рецепт: случайный( или как будто случайное событие)+ всегда на системе данных. См Dunning( 2012) для большего количества примеров.
Что касается обогащенную запрошенных, результаты в Ansolabehere и Херш( 2012) Петля на двух основных этапов:1 способность Catalist объединить множество разрозненных источников данных, чтобы произвести точную мастер- файл данных и 2 способность Catalist связать данные обследования для его мастер- файл данных. Поэтому Ansolabehere и Херш проверить каждый из этих шагов внимательно.
Наиболее широко обсуждаемая особенность больших источников данных заключается в том, что они БОЛЬШИЕ. Например, многие статьи начинают, обсуждая, а иногда и хвастаясь, о том, сколько данных они анализировали. Например, в публикации, опубликованной в Science, изучающей тенденции использования слов в корпусе Google Books, были включены следующие( Michel et al. 2011).
Таблица 2. 2: Примеры цифровых следов, которые используются в качестве меры более абстрактных теоретических концепций. Социальные ученые называют этот матч построить действия, иэто является одной из основных проблем с использованием больших источников данных для социальных исследований( Lazer 2015).
Многие важные вопросы в социальных исследованиях могут быть выражены в качестве одного из этих трех. Тем не менее, эти подходы обычно требуют исследователей, чтобы принести много к данным. Что делает Farber( 2015) интересным является теоретическая мотивация для измерения. Эта теоретическая мотивация исходит из-за пределов данных. Таким образом, для тех, кто хорошо задавать определенные типы вопросов исследования,большие источники данных могут быть очень плодотворными.
Иногда бывают настройки, где случайность в мире бывает, чтобы создать что-то вроде эксперимента для исследователей. Эти конструкции называются естественные эксперименты,и они будут подробно рассмотрены в разделе 2. 4. 3. 1. Две особенности больших источников данных- их всегда на природе и их размер, значительно увеличивает нашу способность учиться на естественных экспериментов, когда они происходят.
Эти три хорошие свойства больших объемов данных для социальных исследований, большой, всегда на, и не реактивно- возникают, как правило, потому что эти источники данных не были созданы исследователями для исследования. Теперь,я превращу к семи свойств больших источников данных, которые плохо для исследований. Эти функции также, как правило, возникают из-за этих данных не была создана исследователями для исследования.
Каковы общие уроки исследователи могут извлечь из этого исследования? Во-первых, существует огромное значение от обогащения цифровых следов с данными обследования. Во-вторых, даже если они агрегируются,коммерческие источники данных не следует рассматривать как" земля истина", а в некоторых случаях они могут быть полезны. На самом деле, лучше всего сравнить эти источники данных не абсолютной Истины( от которого они всегда будут падать короткий). Скорее, это лучше сравнить их с другими имеющимися источниками данных, которые неизменно содержат ошибки, а также.
Рисунок 2. 12: Изображение- и утка, и кролик; то, что вы видите, зависит от вашей перспективы.Большие источники данных найдены и разработаны; опять же, то, что вы видите, зависит от вашей перспективы. Например, записи данных о вызовах, собранные компанией мобильной телефонной связи, считаются данными с точки зрения исследователя. Но эти точные записи представляют собой данные с точки зрения того, кто работает в отделе биллинга телефонной компании. Источник: Popular Science Monthly( 1899)/ Wikimedia Commons.
В журнале« Политическая наука» был проведен симпозиум по крупным данным, каузальным выводам и формальной теории, а Clark and Golder( 2015) суммируют каждый вклад. В журнале« Труды Национальной академии наук Соединенных Штатов Америки» был проведен симпозиум по каузальным выводам и большим данным, аShiffrin( 2016) суммирует каждый вклад. Для подходов машинного обучения, которые пытаются автоматически обнаружить естественные эксперименты внутри больших источников данных, см. Jensen et al.( 2008), Sharma, Hofman, and Watts( 2015), Sharma, Hofman, and Watts( 2016).
В дополнение к изучению непредвиденных событий, всегда в больших системах данных также позволяют исследователям производить оценки в реальном времени, что может иметь важное значение в условиях, когда разработчики политики- в правительстве или отрасли- хотят реагировать на основе ситуационной осведомленности. Например, данные социальных сетей могутиспользоваться для направления экстренного реагирования на стихийные бедствия( Castillo 2016) и можно использовать множество различных источников данных, которые производят оценки экономической активности в реальном времени( Choi and Varian 2012).