Archivo del foro de PucelaBits del Friday November 17, 2023.
Big Data (lo gratuito sale muy caro)
CiberConfundido
¿Qué es Big Data?
Debido al gran avance que existe día con día en las tecnologías de información, las organizaciones se han tenido que enfrentar a nuevos desafíos que les permitan analizar, descubrir y entender más allá de lo que sus herramientas tradicionales reportan sobre su información, al mismo tiempo que durante los últimos años el gran crecimiento de las aplicaciones disponibles en internet (geo-referenciamiento, redes sociales, etc.) han sido parte importante en las decisiones de negocio de las empresas. El presente artículo tiene como propósito introducir al lector en el concepto de Big Data y describir algunas características de los componentes principales que constituyen una solución de este tipo
The human race produces 2.5 quintillion bytes of data every day—far too much to crunch using conventional desktop applications. Mining this mountain of data for nuggets usable information is one of the biggest challenges facing modern society. But a new generation of analytic tools are helping us control the phenomenon that’s becoming commonly known as Big Data.
Big Data is a catch-all term for the manipulation of data sets so large…
It’s not hard to collect large quantities of data. The world’s per-capita information storage capacity doubled every 40 months since the 1980s. Now, it comes from every imaginable source—from social media and web text to climate information, digital media, online sales receipts, RFID readers, change logs, and cellular triangulation records. The real challenge is what to do with it.
…they cannot be effectively analyzed using common commercially-available programs.
Twitter generates somewhere on the order of 12 terabytes of data every 24 hours. The Large Hadron Collider (LHC) produced 13 petabytes of data in 2010. Even Walmart handles more than 1 million customer transactions every hour. Analyzing this torrent of information, whether to quickly spot emerging trends, track the Higg-Boson particle, or accurately identity fraud at the checkout, requires a bit more computational power than MS Access.
Instead, specialized analytic suites like the Apache Hadoop Big Data Platform run in parallel across hundreds or even thousands of servers. They’re known as collectively as massively parallel-processing databases. These giant machines work around the clock to manage and make sense of these unwieldy data sets.
CiberConfundido
Windows 10 envía a Microsoft la clave de cifrado de discos
Windows 10 sigue deparando sorpresas, la última es que si se realiza un cifrado del disco el sistema envía automáticamente la clave para descifrarlo a los servidores de Microsoft como “copia de seguridad”. Actualmente no existe ningún método para evitarlo pues solo en los Win10 superiores, pero no el Home, puede tratar de revertirse el proceso. En los Windows Pro y Ultimate es posible descifrar el disco y volverlo a cifrar eligiendo no enviar el dato a Microsoft, pero solo después de un primer cifrado de disco con envío a Microsoft.
Microsoft publica las cifras del ‘espionaje’ de Windows 10
Microsoft ha publicado un informe en el que muestra las estadísticas de uso de Windows 10, y además de unos datos curiosos nos dejan con una duda: ¿qué pasa con nuestra privacidad?
Desde que Microsoft dijo que la actualización a Windows 10 sería gratis, muchas son las personas que se han lanzado a actualizar a esta nueva versión del famoso sistema operativo. Ni más ni menos que 200 millones de dispositivos. Ahí es nada. El caso es que Microsoft ha sido muy criticada por estar espiando a los usuarios mediante su sistema operativo, y la compañía de Redmond se ha defendido diciendo, básicamente, que no. Sin embargo, las últimas informaciones reflejan que la empresa de Bill Gates tiene mucha información, quizá más de la que necesite o de la que debería tener.
Microsoft y la utopía de la privacidad
Ante tanta crítica, Microsoft decidió actualizar su políticia de privacidad, explicando cuándo y cómo se accedía a los datos de sus usuarios. Todo muy bonito, pero con la actualización de Noviembre -Threshold 2-, Microsoft ha vuelto a las andadas, y está muy pendiente de cuánto tiempo pasan los usuarios haciendo uso de su sistema operativo, sus aplicaciones y sus funcionalidades. Todos estos datos son enviados a Redmond. Y ahí le perdemos el rastro.
Parece ser que la empresa está muy contenta con los resultados de su sistema operativo, y para mostrar su entusiasmo ha publicado una entrada en su blog oficial enseñándonos muchísimos datos. En ellos se nos muestra cómo ha ido evolucionando la adopción de Windows 10 y cómo se usan sus aplicaciones -entre otras cosas-. Aunque hay algunas superfluas, lo cierto es que hay algunos datos interesantes que nos gustaría enseñaros.
¿Cuánto tiempo hemos estado usando Windows 10?
Según la propia fuente, y como confirmó Yusuf Medhi -vicepresidente del Grupo de Dispositivos Windows-, ya hay más de 200 millones de dispositivos con Windows 10 corriendo por sus venas, pero tampoco es un dato para echar cohetes. Recordemos que la actualización era gratuita, por lo que muchos usuarios habrán actualizado por la mera inercia del “It’s free!”. Así de bonito nos lo han vendido:
Las cifras recabadas por Windows 10
Veamos algunos de los datos más curiosos:
El crecimiento de Windows 10 ha sido de un 140% con respecto a Windows 7 y un 400% en comparación con Windows 8.
Los usuarios de Windows 10 han empleado más de 11 mil millones de horas en este nuevo sistema operativo, y solo durante el mes de diciembre.
De todo este tiempo, 45 mil millones de minutos han sido usados navegando por Microsoft Edge, el nuevo navegador de Windows que, francamente, no termina de despegar y aun necesita algún que otro retoque.
Cortana ha realizado más de 2.500 millones de búsquedas desde su lanzamiento.
Los gamers han empleado más de 4 mil millones de horas jugando en el ordenador, de las cuales 6,6 millones de horas han sido a través de su plataforma Xbox One Games.
Se han visto más de 82 mil millones de fotos mediante la aplicación integrada de Windows 10.
Se han duplicado las transacciones en la Windows Store. Además, el 60% de los que hicieron una compra en diciembre eran nuevos usuarios.
Bing ha sido usado un 30% más que en versiones anteriores.
Muchos datos, pero si te preocupa un mínimo tu privacidad ya deberías estar preocupado.
Si el producto es gratis, tú eres el producto
Parece ser que la empresa creadora de Windows ha estado recolectando más datos de los que, supuestamente, iban a coger al inicio. Vamos a reflexionar un poco sobre este hecho, porque nos afecta de manera directa. Lo primero de todo es que no sabemos qué datos está recogiendo exactamente. Sabemos que el tiempo que pasamos usando sus aplicaciones y sistema si lo tienen monitorizado, pero no sabemos qué hacen con los datos obtenidos de nuestras búsquedas en Cortana.
Ese es el verdadero problema. No sabemos qué pasa con nuestros datos. Está claro que nosotros hemos accedido a esta actualización gratuita, en muchas ocasiones, sin leer los términos y condiciones de uso. Hay un dicho, y es que si el producto es gratis, tú eres el producto. Si la empresa no gana dinero con la actualización lo ganará por otro lado, y ese otro lado se refiere a tus datos -y los míos, que yo también uso Windows 10-. Datos que por cierto ha publicado en una entrada de su blog oficial.
La explicación oficial que dan desde Microsoft es que estos datos tienen un objetivo muy claro: mejorar el producto -por eso con la actualización de noviembre volvieron a cambiar las condiciones, claro-. Esta explicación es válida, puesto que el sistema operativo busca adecuarse a nuestros hábitos, pero Microsoft no destaca por su transparencia en ese sentido.
CiberConfundido
La batalla por el ‘big data’ llega al coche
Panasonic y otros grupos estudian barreras para evitar que Apple y Google controlen los datos que se generan desde el vehículo
El informe realizado por KPMG con la opinión de 800 directivos y 2.100 conductores pone de relieve que la escala de prioridades del sector ha dado un vuelco en sólo un año. La tendencia más importante que se señala ahora es la conectividad y la digitalización, algo que en el informe del año pasado aparecía en décima posición.
El nuevo concepto de movilidad tiene sin embargo muchas preguntas sin respuesta, como destaca Xavier Busquets, profesor del departamento de Operaciones, Innovación y Data Sciences en Esade. “En el momento en que los coches se hablen entre sí, ¿cómo será el tráfico?, ¿cómo se regulará?, ¿de quién será la responsabilidad civil?, ¿se asegurará la privacidad de los datos?, ¿será posible desconectarse?, ¿cómo serán los protocolos de comunicación entre coches?”. Son sólo algunas preguntas que muestran la complejidad que implica convertir a los automóviles en “robots autónomos dotados de inteligencia”, como los define Busquets.
De momento, ya se ha desencadenado una batalla soterrada por el control de los datos que genera un vehículo durante su utilización, desde las costumbres del conductor, lo que puede tener un efecto sobre los seguros, hasta sus gustos, las webs que visita o las compras on line que realiza. El gran temor es que los datos acaben controlados por Apple y Google, los propietarios de los sistemas operativos que facilitan la conexión. Por eso, Panasonic y otros grupos japoneses están intentando desarrollar algún tipo de barrera para evitar el dominio de Apple y Google en el ámbito de los datos.
De hecho, esos dos gigantes tecnológicos ven la automoción como una enorme oportunidad de negocio, teniendo en cuenta que cada año se fabrican 100 millones de coches en todo el mundo. Los dos disponen de cash, en particular Apple, y están dispuestos a jugar fuerte en el nuevo campo que se les ha abierto.
“El que controla los datos controla al cliente y sus posibilidades de fidelización”, argumenta Josep Maria Forcadell, responsable de ventas de la división de automoción de Ficosa.
Los datos se ven como algo muy valioso y no sólo para los fabricantes de vehículos o los proveedores de sistemas. Cuatro de cada cinco conductores encuestados por KPMG esperan obtener beneficios económicos a cambio de ceder al fabricante los datos que genera su vehículo. “Es obvio que los clientes son conscientes del valor de sus datos, y los resultados de este informe indican que el beneficio económico que puedan sacar de ellos es la máxima prioridad”, dice Francisco Roger, socio responsable del sector Automoción de KPMG en España. Así, el 82% de los conductores encuestados declara que los beneficios económicos obtenidos a cambio de facilitar sus datos son la ventaja más atractiva, seguida de cerca por los incentivos comerciales (75%) y los servicios individualizados y experiencias de usuario dirigidas al cliente.
“Nada va a ser igual en el sector de la automoción. Los modelos de negocio, en constante cambio e impulsados por los datos, deben allanar el camino hacia la captación y fidelización del actor principal: el cliente. Convertirse en un proveedor de servicios orientado al cliente adquiere la máxima importancia a la hora de cubrir sus necesidades actuales”, añade Dieter Becker, responsable global de automoción de KPMG.
No obstante, la mayoría de los ejecutivos de la industria automovilística encuestados admite que el uso de datos y la aplicación de técnicas de ingeniería de la información aún están dando sus primeros pasos.
Automotive Grade Linux is a collaborative open source project that aims to accelerate the development and adoption of a fully open software stack for the connected car. Leveraging the power and strength of Linux at its core, AGL is uniting automakers and technology companies to develop a common platform that offers OEMs complete control of the user experience so the industry can rapidly innovate where it counts. The AGL platform is available to all, and anyone can participate in its development. Learn more: https://www.automotivelinux.org/
CiberConfundido
la solución no es LINUX, es no tener internet en los coches.
nukeador
O tener sistemas que podamos auditar y confiar en que no comparten nuestros datos.
Tengo pendiente escribir sobre este tema que va a ser más y más relevante los próximos años, como el “Internet de las cosas” puede ser peligroso si sigue controlado por los que ahora ya controlan teléfonos y tablets
CiberConfundido
Estoy en contra de la idea de que no se podrá vivir en un futuro próximo sin tener todo conectado a internet. No necesito nevera inteligente y menos un coche que sepa a dónde voy. Vale que lo habrá, pero son ganas de perder privacidad. La única opción segura es no tenerlo.
explorer
Que el coche sepa dónde vamos es genial porque me avisará de condiciones climáticas en el destino, o de problemas de tráfico en el trayecto. Y si es un coche autónomo, me podré echar una siesta o terminar de leer la última novela de éxito.
Ahí no hay problemas. Lo que es problemático es si las empresas que me dan esos servicios usan esa información para inundarme el teléfono, reloj, gafas o buzón de correo, de publicidad.
Piensa que… aunque el coche no tenga Internet, tu teléfono/reloj/gafas/tableta sí que lo tienen. Son muchos conductores los que usan la información de tráfico en el Maps de Google, o la información que envían otros conductores, a través del teléfono.
La gente ha visto las enormes ventajas de tener un simple GPS en el coche, así que la evolución hacia la conexión a Internet y el protocolo C2C es algo natural. Y no va a renunciar a esas ventajas, aunque les avisemos que se convertirán en fuentes de datos. No les importa. Ven las ventajas mucho mayores que las desventajas. A fin de cuentas, las empresas recaban datos nuestros desde hace décadas y el público lo acepta.
Lo que nos debe importar es que deben existir opciones a esa “vigilancia”, o poder decidir qué datos queremos “compartir” (incluida la opción de “ninguno”).
nukeador
Yo creo que no es cuestión de que se pueda o no, claramente se puede porque siempre lo hemos hecho, es cuestión de si tendremos esa elección cuando todos los elementos que compremos vengan con un chip conectado a la red del cual no tenemos control o conocimiento.
Creo que más importante es que por ley y por defecto nadie pueda recopilar información nuestra sin nuestro consentimiento explicito y de forma comprensible para cualquier persona (no detrás de un contrato de 100 páginas).
explorer
La actual LOPD lo garantiza, pero los contratos de 100 páginas siguen siendo necesarios. No se puede dejar ningún cabo suelto, cuando ofreces cierto tipo de servicios.
nukeador
¿Se está cumpliendo la LOPD?
Aunque los contratos sea necesarios, también lo es que la persona que acepta un acuerdo sea capaz de entender lo que está aceptado, si no creo que es un engaño intencionado presentar una maraña de textos legales para que la gente no pueda ser capaz de entender qué acepta.
explorer
Sí, la LOPD se cumple. Y si una empresa no la cumple, la faltará un telediario para que reciba una bonita multa por parte de la aepd, a causa de una denuncia de un competidor suyo, claro (cosa que ocurre desde hace años).
Más en serio: las empresas confían en lo que dicen sus abogados sobre el cumplimiento de la LOPD, pero el caso es que la mayor parte de las veces son soluciones de risa. Por ejemplo, la manía esa de poner los pies de página en los correos electrónicos con el clásico párrafo legal de si LOPD, que si la LSSI, que si los derechos ARCO… cuando resulta que… ¡no es necesario ponerlo! (en la mayor parte de los correos).
Sobre el tema de las 100 hojas, decir que, ahora mismo no recuerdo un texto tan largo que haya leído y firmado. Quizás el más largo haya sido alguna licencia de Windows, pero el resumen era “no nos responsabilizamos de nada”, “esta copia es una licencia de uso, no una cesión de propiedad” y, “si se le ocurre hacer copias de esto, se le caerá el pelo”
La mayor parte de las personas firmará lo que sea si el que se lo ofrece le inspira confianza (acordémonos de las preferentes). Y… no le preocupa no entender lo que está firmando. Solo quiere recibir el servicio/producto que le han ofrecido, pagar, y ya.
nukeador
Casi cualquier servicio web actual tiene un galimatias por acuerdo de uso, que aceptas sin leer al crear una cuenta.