All language subtitles for gis-capstone - 15 - Assessing Data Quality and Uncertainty (Review from Data Formats, Design, & Quality).es

af Afrikaans
ak Akan
sq Albanian
am Amharic
ar Arabic Download
hy Armenian
az Azerbaijani
eu Basque
be Belarusian
bem Bemba
bn Bengali
bh Bihari
bs Bosnian
br Breton
bg Bulgarian
km Cambodian
ca Catalan
ceb Cebuano
chr Cherokee
ny Chichewa
zh-CN Chinese (Simplified)
zh-TW Chinese (Traditional)
co Corsican
hr Croatian
cs Czech
da Danish
nl Dutch
en English
eo Esperanto
et Estonian
ee Ewe
fo Faroese
tl Filipino
fi Finnish
fr French
fy Frisian
gaa Ga
gl Galician
ka Georgian
de German
el Greek
gn Guarani
gu Gujarati
ht Haitian Creole
ha Hausa
haw Hawaiian
iw Hebrew
hi Hindi
hmn Hmong
hu Hungarian
is Icelandic
ig Igbo
id Indonesian
ia Interlingua
ga Irish
it Italian
ja Japanese
jw Javanese
kn Kannada
kk Kazakh
rw Kinyarwanda
rn Kirundi
kg Kongo
ko Korean
kri Krio (Sierra Leone)
ku Kurdish
ckb Kurdish (Soranî)
ky Kyrgyz
lo Laothian
la Latin
lv Latvian
ln Lingala
lt Lithuanian
loz Lozi
lg Luganda
ach Luo
lb Luxembourgish
mk Macedonian
mg Malagasy
ms Malay
ml Malayalam
mt Maltese
mi Maori
mr Marathi
mfe Mauritian Creole
mo Moldavian
mn Mongolian
my Myanmar (Burmese)
sr-ME Montenegrin
ne Nepali
pcm Nigerian Pidgin
nso Northern Sotho
no Norwegian
nn Norwegian (Nynorsk)
oc Occitan
or Oriya
om Oromo
ps Pashto
fa Persian
pl Polish
pt-BR Portuguese (Brazil)
pt Portuguese (Portugal)
pa Punjabi
qu Quechua
ro Romanian
rm Romansh
nyn Runyakitara
ru Russian
sm Samoan
gd Scots Gaelic
sr Serbian
sh Serbo-Croatian
st Sesotho
tn Setswana
crs Seychellois Creole
sn Shona
sd Sindhi
si Sinhalese
sk Slovak
sl Slovenian
so Somali
es Spanish
es-419 Spanish (Latin American)
su Sundanese
sw Swahili
sv Swedish
tg Tajik
ta Tamil
tt Tatar
te Telugu
th Thai
ti Tigrinya
to Tonga
lua Tshiluba
tum Tumbuka
tr Turkish
tk Turkmen
tw Twi
ug Uighur
uk Ukrainian
ur Urdu
uz Uzbek
vi Vietnamese
cy Welsh
wo Wolof
xh Xhosa
yi Yiddish
yo Yoruba
zu Zulu
Would you like to inspect the original subtitles? These are the user uploaded subtitles that are being translated: 1 00:00:00,000 --> 00:00:08,412 [MÚSICA] 2 00:00:08,412 --> 00:00:09,810 Hola de nuevo a todos. 3 00:00:09,810 --> 00:00:14,798 En este vídeo vamos a dar un paso atrás en el amplio concepto de incertidumbre 4 00:00:14,798 --> 00:00:16,265 y error. 5 00:00:16,265 --> 00:00:19,040 Vamos a discutir esto en algunas conferencias porque es un 6 00:00:19,040 --> 00:00:21,515 concepto relativamente grande que afecta todo lo que se hace en SIG. 7 00:00:21,515 --> 00:00:22,689 En esta lección, 8 00:00:22,689 --> 00:00:27,700 aprenderá acerca de los amplios tipos de incertidumbre que afectan a los datos geográficos. 9 00:00:27,700 --> 00:00:30,300 Y luego hablaremos específicamente sobre la incertidumbre y 10 00:00:30,300 --> 00:00:31,840 cómo conceptualizamos nuestros datos. 11 00:00:31,840 --> 00:00:35,560 Para que podamos tomar las decisiones apropiadas cuando diseñamos 12 00:00:35,560 --> 00:00:37,530 flujos de trabajo de recopilación o análisis de datos. 13 00:00:37,530 --> 00:00:40,150 Estos temas son simultáneamente mundanos y 14 00:00:40,150 --> 00:00:44,090 fascinantes, así que trataré de darte muchos ejemplos para mantenerte interesado. 15 00:00:44,090 --> 00:00:46,160 Pero asegúrese de pausar el video cada vez 16 00:00:46,160 --> 00:00:48,530 para pensar en cómo se aplica a su propio trabajo. 17 00:00:49,910 --> 00:00:52,380 Cuando digo incertidumbre y error, 18 00:00:52,380 --> 00:00:56,810 estoy hablando de factores que afectan la calidad de nuestros datos y nuestra capacidad de 19 00:00:56,810 --> 00:01:01,368 confiar en que los datos que generamos representan con precisión la realidad en un área determinada. 20 00:01:01,368 --> 00:01:06,290 Seguiremos volviendo al concepto de representar la realidad porque 21 00:01:06,290 --> 00:01:10,790 los datos SIG son aceptados a menudo como verdad, pero en realidad es solo una representación de ella. 22 00:01:11,850 --> 00:01:15,870 Necesitamos entender cómo los errores y la incertidumbre ingresan en nuestros datos, 23 00:01:15,870 --> 00:01:20,940 saber cómo podemos evaluar y analizar legítimamente esos datos, obtener respuestas sobre 24 00:01:20,940 --> 00:01:25,620 lugares reales y no solo respuestas sobre esos datos en sí. 25 00:01:25,620 --> 00:01:29,040 Antes de sumergirnos, permítanme darles un ejemplo de mi propio trabajo. 26 00:01:29,040 --> 00:01:32,711 Los datos del terreno o los modelos digitales de elevación pueden ser increíblemente importantes para el 27 00:01:32,711 --> 00:01:36,382 trabajo hidrológico porque nos ayuda a responder a esa pregunta crítica de, 28 00:01:36,382 --> 00:01:38,570 ¿dónde fluye el agua? 29 00:01:38,570 --> 00:01:41,310 Pero un modelo digital de elevación, o DEM para 30 00:01:41,310 --> 00:01:45,810 abreviar, es solo una aproximación del paisaje, ya que a menudo solo tiene una 31 00:01:45,810 --> 00:01:49,700 celda ráster para encontrar la altura del terreno cada 10 a 90 metros. 32 00:01:49,700 --> 00:01:52,560 Cuando procesamos DEM para encontrar caminos cuesta abajo para el 33 00:01:52,560 --> 00:01:56,950 agua, acumulamos errores en ellos basados en la incertidumbre de los datos. 34 00:01:56,950 --> 00:02:00,300 Esto se debe a que en paisajes montañosos y cambiantes, es probable que obtengamos 35 00:02:00,300 --> 00:02:04,260 una visión amplia de dónde están las salidas de agua y las confluencias fluviales, pero 36 00:02:04,260 --> 00:02:06,860 el procesamiento puede introducir errores en las escalas locales. 37 00:02:06,860 --> 00:02:09,360 Hasta el punto de que a menudo no puede estar 38 00:02:09,360 --> 00:02:13,960 seguro de los resultados específicos sin una validación significativa de datos. 39 00:02:13,960 --> 00:02:18,020 Los ríos pueden mostrar como que fluyen a 100 metros de distancia de donde realmente están. 40 00:02:18,020 --> 00:02:20,980 Si mi objetivo es conocer las áreas aguas arriba en un lugar, 41 00:02:20,980 --> 00:02:22,340 esto probablemente esté bien. 42 00:02:22,340 --> 00:02:25,070 Pero si mi objetivo es obtener ubicaciones específicas de ríos para 43 00:02:25,070 --> 00:02:28,840 mi geoprocesamiento, entonces no puedo confiar en los datos sin una validación adicional. 44 00:02:29,980 --> 00:02:32,380 Podría usarlo para el trabajo preliminar, etc. 45 00:02:32,380 --> 00:02:36,210 Pero para los productos finales, o bien necesitaría comprender el error introducido para 46 00:02:36,210 --> 00:02:40,460 poder moderar mis resultados en consecuencia, o entenderlo, luego corregirlo por completo. 47 00:02:42,030 --> 00:02:44,455 Cuando hablamos de incertidumbre de los fenómenos geográficos, 48 00:02:44,455 --> 00:02:48,050 podemos agruparlos ampliamente en cuatro categorías. 49 00:02:48,050 --> 00:02:51,220 Primero, tenemos incertidumbre en nuestra concepción del fenómeno 50 00:02:51,220 --> 00:02:52,250 que estamos midiendo. 51 00:02:52,250 --> 00:02:54,660 Tal vez aún no entendemos claramente lo que estamos buscando. 52 00:02:55,760 --> 00:02:58,620 En segundo lugar, tenemos incertidumbre en la medida misma, 53 00:02:58,620 --> 00:03:00,970 como el error introducido por nuestros instrumentos. 54 00:03:02,020 --> 00:03:06,670 En tercer lugar, tenemos incertidumbre introducida por nuestra elección de cómo representar los datos, 55 00:03:06,670 --> 00:03:09,360 como el uso de datos ráster o vectoriales. 56 00:03:09,360 --> 00:03:13,680 Y por último, tenemos incertidumbre introducida por nuestra elección en nuestro análisis, 57 00:03:13,680 --> 00:03:18,460 como el uso disponible en una escala diferente para representar nuestros artículos de interés. 58 00:03:19,490 --> 00:03:22,730 Entonces, comencemos con la primera parte del proceso de investigación, 59 00:03:22,730 --> 00:03:24,770 nuestra concepción de nuestro problema. 60 00:03:24,770 --> 00:03:28,000 Para empezar, necesitamos definiciones repetibles y objetivas 61 00:03:28,000 --> 00:03:30,930 de nuestro fenómeno de interés, de modo que podamos obtener datos sobre él. 62 00:03:31,950 --> 00:03:33,880 Eso es más difícil de lo que parece. 63 00:03:33,880 --> 00:03:36,810 Por ejemplo, ¿quién es nuestro cliente? 64 00:03:36,810 --> 00:03:38,170 ¿ Cuáles son sus intereses? 65 00:03:39,450 --> 00:03:42,630 ¿ Qué características definen un barrio? 66 00:03:42,630 --> 00:03:44,910 ¿ Qué constituye específicamente un humedal? 67 00:03:46,110 --> 00:03:48,820 ¿ Cuántos robles y a qué densidad se necesita para que 68 00:03:48,820 --> 00:03:51,950 algo sea clasificado como Oak Woodland versus Prassland? 69 00:03:53,650 --> 00:03:57,820 Este concepto se traduce aún más en la puntuación de un atributo, 70 00:03:57,820 --> 00:04:01,230 ¿qué define específicamente un grado de A frente a B? 71 00:04:02,790 --> 00:04:04,900 ¿ Qué 72 00:04:04,900 --> 00:04:07,450 significa realmente un grado de inaceptable, para la protección de diques de la llanura de inundación? 73 00:04:08,510 --> 00:04:11,000 Tenemos que entender las compensaciones que hacemos aquí. 74 00:04:11,000 --> 00:04:14,840 Estamos necesariamente generalizando una población en algún tipo de 75 00:04:14,840 --> 00:04:19,260 unidad agregada, y no podemos mantener toda la información sobre los individuos. 76 00:04:19,260 --> 00:04:19,970 Los estamos agrupando para 77 00:04:19,970 --> 00:04:24,730 que podamos estudiarlos como una unidad, pero los individuos tienen diversidad. 78 00:04:24,730 --> 00:04:28,300 Así que definimos las características de interés para nuestro estudio, pero 79 00:04:28,300 --> 00:04:31,830 también tenemos en cuenta las compensaciones de las características que estamos dejando de lado, 80 00:04:31,830 --> 00:04:34,930 para que podamos entender las limitaciones de nuestro análisis. 81 00:04:34,930 --> 00:04:37,840 No podemos inferir cosas sobre la información que dejamos a un lado. 82 00:04:39,110 --> 00:04:43,260 Tomando aún más esta incertidumbre y concepción, consideremos el caso de que 83 00:04:43,260 --> 00:04:48,240 sabemos lo que queremos medir, pero no tenemos la instrumentación, el tiempo 84 00:04:48,240 --> 00:04:51,720 o los recursos para estudiar directamente nuestro tema de interés. 85 00:04:51,720 --> 00:04:56,310 En cambio, medimos algo más que tenemos la capacidad de medir y 86 00:04:56,310 --> 00:05:00,450 que sabemos que está correlacionado de alguna manera con nuestro tema de interés. 87 00:05:00,450 --> 00:05:03,350 Luego, usamos esa información para hacer inferencias sobre 88 00:05:03,350 --> 00:05:05,340 el fenómeno de interés. 89 00:05:05,340 --> 00:05:08,170 Piensa en ello como medir algo por proxy. 90 00:05:08,170 --> 00:05:11,690 Puede introducir un error significativo, pero también puede ser muy necesario. 91 00:05:12,785 --> 00:05:15,915 Tal vez usted necesita saber cuántos coches hay en una ciudad en particular pero 92 00:05:15,915 --> 00:05:18,185 no puede llevar a cabo un censo real. 93 00:05:18,185 --> 00:05:22,195 Usted tiene la información de la población de la ciudad y el número de hogares, y 94 00:05:22,195 --> 00:05:26,985 sucede que conoce el promedio estatal de propiedad de automóviles basado en investigaciones previas. 95 00:05:26,985 --> 00:05:30,305 Puedes usar esa información para inferir la propiedad del coche, pero 96 00:05:30,305 --> 00:05:33,435 hemos introducido un error ya que ahora asumimos que nuestra ciudad es 97 00:05:33,435 --> 00:05:36,055 media en lugar de en algún otro punto del espectro. 98 00:05:37,090 --> 00:05:40,860 Del mismo modo, tal vez queramos saber dónde están los anfibios, pero ir y 99 00:05:40,860 --> 00:05:43,200 encontrarlos directamente lleva mucho tiempo. 100 00:05:43,200 --> 00:05:46,580 En cambio, utilizamos un proxy para evaluar la humedad de un lugar, a 101 00:05:46,580 --> 00:05:51,560 lo largo del año, utilizando un sensor para inferir si es o no un hábito adecuado. 102 00:05:51,560 --> 00:05:55,620 En este caso, hemos sustituido el hábitat adecuado para los anfibios e 103 00:05:55,620 --> 00:05:57,250 introducido incertidumbre en nuestros datos. 104 00:05:58,940 --> 00:06:02,310 También tenemos problemas con la regionalización de nuestros datos en polígonos. 105 00:06:03,530 --> 00:06:06,600 ¿ Qué combinación de características define una zona? 106 00:06:07,690 --> 00:06:11,931 ¿ Cuándo algo que varía continuamente deja de estar en un grupo o polígono 107 00:06:11,931 --> 00:06:13,410 y comienza a estar en otro? 108 00:06:14,570 --> 00:06:17,450 ¿ Utilizamos umbrales de tamaño o esquemas de espera? 109 00:06:17,450 --> 00:06:21,250 ¿ Utilizamos análisis difusos donde guardamos parte de esta gradación o 110 00:06:21,250 --> 00:06:23,910 análisis nítidos donde dibujamos líneas claras? 111 00:06:23,910 --> 00:06:28,300 ¿ Tenemos los datos que necesitamos para asignar o doblar datos en estos grupos de todos modos? 112 00:06:28,300 --> 00:06:31,230 A veces esto es claro como en el caso de la propiedad. 113 00:06:31,230 --> 00:06:36,310 Si trazamos límites de propiedad generalmente tenemos reglas claras de quién es dueño de un área. 114 00:06:36,310 --> 00:06:39,510 Pero, ¿y si tratamos de clasificar el paisaje en su lugar? 115 00:06:39,510 --> 00:06:42,980 Tal vez queremos definir la idoneidad para un uso particular. 116 00:06:42,980 --> 00:06:46,970 Para los planificadores urbanos, puede preguntarse si desea representar un uso del suelo, como una 117 00:06:46,970 --> 00:06:51,570 actividad industrial, como un único tipo en un mapa, o si debe dividirlo en 118 00:06:51,570 --> 00:06:55,610 zonas más específicas que definan tipos específicos de actividades. 119 00:06:56,670 --> 00:06:59,519 Del mismo modo, ¿dónde trazamos los límites de un barrio? 120 00:07:00,680 --> 00:07:04,300 Diferentes grupos ocupan diferentes áreas y esto varía continuamente y 121 00:07:04,300 --> 00:07:07,880 es difícil saber dónde termina un barrio y comienza otro. 122 00:07:09,042 --> 00:07:12,620 Para un peligro de huracán de mapa, puede preguntarse cómo ponderar los atributos 123 00:07:12,620 --> 00:07:16,430 para crear su puntuación de peligros, lo que afecta a la forma en que se crean los polígonos para 124 00:07:16,430 --> 00:07:17,030 los resultados. 125 00:07:18,310 --> 00:07:21,050 Si estabas buscando crear polígonos de regiones climáticas, 126 00:07:21,050 --> 00:07:24,110 necesitarás decidir las características de cada zona, de 127 00:07:24,110 --> 00:07:27,370 modo que puedas asignar ubicaciones dadas a cada una de ellas. 128 00:07:28,930 --> 00:07:32,390 En todo esto, tendrá que entender cómo afecta a 129 00:07:32,390 --> 00:07:34,370 los elementos individuales en el análisis. 130 00:07:34,370 --> 00:07:37,910 ¿ Debería haber terminado la asignación en un grupo u otro? 131 00:07:37,910 --> 00:07:39,980 Y como mencionamos antes, 132 00:07:39,980 --> 00:07:42,940 ¿a qué especificidad renunciamos en nuestros datos agrupándolos? 133 00:07:44,790 --> 00:07:47,350 Vale, lo dejaremos aquí por ahora. 134 00:07:47,350 --> 00:07:51,710 En este video discutimos los amplios tipos de incertidumbre que afectan a nuestros 135 00:07:51,710 --> 00:07:56,350 datos geográficos y luego entramos en detalle en un tipo específico de incertidumbre. 136 00:07:56,350 --> 00:07:58,909 Incertidumbre y error en la concepción de nuestros datos. 137 00:08:00,080 --> 00:08:04,400 Aprendimos acerca de las fuentes de error a partir de nuestra definición de nuestro fenómeno de interés, 138 00:08:04,400 --> 00:08:07,740 de nuestra capacidad para medir directamente ese fenómeno y 139 00:08:07,740 --> 00:08:12,790 de cómo decidimos regionalizar o agrupar individuos en categorías útiles. 140 00:08:12,790 --> 00:08:15,660 Realmente te animo a pensar en cómo estos factores afectan tu 141 00:08:15,660 --> 00:08:16,950 propio trabajo, ahora mismo. 142 00:08:16,950 --> 00:08:20,540 Así que obtienes práctica aplicándolos y trabajando a través de las compensaciones. 143 00:08:20,540 --> 00:08:24,300 En el siguiente video, continuaremos donde lo dejamos discutiendo la incertidumbre y 144 00:08:24,300 --> 00:08:26,080 cómo medimos los datos y vamos a partir de ahí.14309

Can't find what you're looking for?
Get subtitles in any language from opensubtitles.com, and translate them here.