分享

[德语语言] 什么是“大数据”(Big Data)和数据安全(Datenschutz)? 了解一下

 吕律德语老师 2020-07-31

什么是大数据(Big Data)?去年底我观看了一个在线的学术会议,其中一句话印象深刻:我们身处大数据的海洋,却面临着渴死的危险。参见我之前的文章: [德语语言] 大数据时代,说说德语中Korpus(语料库)这个单词

所以建造数据库(Korpus)非常重要。那么首先需要明确一个概念:什么是大数据?英语是Big Data,德语是Massendaten。大数据是构成数码技术的信息总量的一个总概念。为什么称其为“大”?这个大就具备三个维度,分别是范围,速度和总量上均具备了充分的信息量。所以请阅读下面的文章,了解一下大数据的概念以及其在大众媒体中的应用范围,当然还有其不成熟和尚待改进之处。

Lesen Sie bitte den folgenden Text und beantworten Sie bitte die Fragen:

  1. Was versteht man unter "Big Data"?

   2. Was sind die drei Dimensionen von  Big Data?

  3. Was ist die erweiterte Definition von "Big" im Begriff "Big Data"?

  4. Woher stammt "Big Data"? Aus welchen Quellen? 

  5.  Wie kann  Big Data sicher sein? Was versteht man unter Datenschutz? Welche Kritik gibt es an Big Data?

  6. Nennen Sie bitte einige Quellen, die Sie kennen, wenn Sie z.B. eine wissenschaftliche Arbeit schreiben moechten?

 7. Wenn Sie der Autor waeren, ergaenzen  Sie bitte etwas ueber Big Data in China. Was wuerde Sie schreiben?

 8. Wie betrachten Sie den Skandal von Facebook?

 9. Warum sagt man im Text, dass es in diesem Gebiet noch fehlende Normen gibt? Welche Vorschläge können Sie für das neue und in einem gewissen Sinne unreife "Dabeisein" geben?

10. Fühlen Sie sich viel glücklicher in dieser digitalisierten Welt voller Big Data? Begründen Sie Ihre Meinungen bitte.  

请阅读以下出自wiki 的相关词条:“大数据”的概念以及应用和其应改进的地方:

Der aus dem englischen Sprachraum stammende Begriff Big Data [ˈbɪɡ ˈdeɪtə] (von englisch big ‚groß‘ und data ‚Daten‘) bezeichnet Datenmengen, welche beispielsweise zu groß, zu komplex, zu schnelllebig oder zu schwach strukturiert sind, um sie mit manuellen und herkömmlichen Methoden der Datenverarbeitung auszuwerten. Im deutschsprachigen Raum ist der traditionellere Begriff Massendaten (大数据)gebräuchlich.

„Big Data“ wird häufig als Sammelbegriff für digitale Technologien verwendet, die in technischer Hinsicht für eine neue Ära digitaler Kommunikation und Verarbeitung und in sozialer Hinsicht für einen gesellschaftlichen Umbruch verantwortlich gemacht werden.

In der Definition von Big Data bezieht sich das „Big“ auf die drei Dimensionen volume (Umfang, Datenvolumen), velocity (Geschwindigkeit, mit der die Datenmengen generiert und transferiert werden) sowie variety (Bandbreite der Datentypen und -quellen). Erweitert wird diese Definition um die zwei V value und validity, welche für einen unternehmerischen Mehrwert und die Sicherstellung der Datenqualität stehen. Der Begriff „Big Data“ unterliegt als Schlagwort einem kontinuierlichen Wandel; so wird mit ihm ergänzend auch oft der Komplex der Technologien beschrieben, die zum Sammeln und Auswerten dieser Datenmengen verwendet werden. 

Big Data bezeichnet primär die Verarbeitung von großen, komplexen und sich schnell ändernden Datenmengen.Die gesammelten Daten können dabei aus verschiedensten Quellen stammen (Auswahl):

  • Aufzeichnungen verschiedenster Überwachungssysteme(监控系统).

  • die Nutzung von Kunden- oder Bank- bzw. Bezahlkarten (Giro („EC“)-, Kreditkarte),

  • jegliche elektronische Kommunikation, dabei auch die persönlich geprägte, individuell unterschiedliche Art und Weise der Benutzung z. B. eines Smartphones (智能手机)(sowohl manuelle wie geografische Bewegungsmuster),

  • geschäftliche bzw. private Nutzung elektronischer Geräte oder Systeme wie „Fitness“- bzw. „Gesundheitsarmbänder“(智能健康手环) bzw. „Wearables“ wie „Activity Tracker“ oder „Smartwatches“, „Ambient Assisted Living“ („umgebungsunterstütztes Leben“) oder globaler Navigationssysteme wie „GPS“, Smartphones, Computer usw.,

  • die Nutzung von Social-Media-Informationen und -Interaktionen,

  • Kraftfahrzeuge (insbesondere im Kontext „Vernetztes Auto“),

  • vernetzte Technik in Häusern („Smart Homes“(智慧家庭), „Smart Meter“),

  • von Behörden und Unternehmen erhobene und gesammelte Daten.

Kritik

Datenschutz(数据安全)

Der Datenwissenschaftler Andreas Dewes hat in einer Untersuchung gezeigt, dass „anonymisierte“ Daten von Internetnutzern, die von Firmen gesammelt und verkauft werden, wieder entschlüsselt und Personen zugeordnet werden können: "Solche Daten, die sehr intim sein können, machen sicherlich in Einzelfällen auch erpressbar". Unter den von Dewes im Rahmen seiner Untersuchung aus den von Werbefirmen gekauften „anonymen“ Daten von ca. drei Millionen Deutschen Identifizierten waren Mitglieder des Deutschen Bundestags und von Landesparlamenten sowie weitere Personen des öffentlichen Lebens wie Richter, Polizeibeamte oder andere Funktionäre.

Entsolidarisierung

Mit Bezug auf die Versicherungsbeitragsanpassung mittels Big Data wird unter anderem die „Gefahr einer schleichenden Entsolidarisierung in der Versicherung“ hervorgehoben.

Fehlende Normen(标准缺失)

Kritik gibt es an „Big Data“ vor allem dahingehend, dass die Datenerhebung und -auswertung praktisch ausschließlich nach technischen Aspekten erfolgt, also dass beispielsweise der technisch einfachste Weg gewählt wird, die Daten zu erheben und die Auswertung von den Möglichkeiten, diese Daten zu verarbeiten, begrenzt wird. Statistische Grundprinzipien wie das einer repräsentativen Stichprobe werden oft vernachlässigt. So kritisierte die Sozialforscherin Danah Boyd:

  • Größere Datenmengen müssten nicht qualitativ bessere Daten sein

  • Nicht alle Daten seien gleichermaßen wertvoll

  • „Was“ und „Warum“ seien zwei unterschiedliche Fragen

  • Bei Interpretationen sei Vorsicht geboten

  • Nur weil es verfügbar ist, sei es nicht ethisch vertretbar.

Ein Forscher ermittelte beispielsweise, dass Menschen nicht mehr als 150 Freundschaften pflegen (Dunbar-Zahl), was sodann als technische Begrenzung in sozialen Netzwerken eingeführt wurde – in der falschen Annahme, als „Freunde“ bezeichnete Bekanntschaften würden echte Freundschaften widerspiegeln(反映). Sicherlich würde nicht jeder alle seine Facebook-Freunde in einem Interview als Freunde benennen – der Begriff eines „Freundes“ signalisiert bei Facebook lediglich eine Kommunikationsbereitschaft.

Eine entscheidende Frage ist auch, wem die von Privatpersonen gesammelten Daten gehören, wer die Verfügungshoheit über sie behält und wer ihre Nutzung kontrolliert.

Fehlende Regulierung(监管缺失)

Der schleswig-holsteinische Datenschutzbeauftragte Thilo Weichert warnt: „Big Data eröffnet Möglichkeiten des informationellen Machtmissbrauchs durch Manipulation, Diskriminierung und informationelle ökonomische Ausbeutung – verbunden mit der Verletzung der Grundrechte der Menschen.“

Dirk Helbing, Professor für Computational Social Science an der ETH Zurich, warnt vor möglichen Technologien subtiler Manipulation auf Basis von Big Data. Der Technikfolgenabschätzer Armin Grunwald, Leiter des Institut für Technikfolgenabschätzung und Systemanalyse (ITAS) in Karlsruhe, warnt, es habe zu keiner Zeit in der Menschheitsgeschichte „derart gute Bedingungen für eine totalitäre Diktatur“ gegeben wie heute.

Fehlende Substanz der Auswertungen

Ein anderer kritischer Ansatz setzt sich mit der Frage auseinander, ob Big Data das Ende aller Theorie bedeutet. Chris Anderson, Chefredakteur beim Magazin Wired 《连线》beschrieb 2008 das Glaubwürdigkeitsproblem jeder wissenschaftlichen Hypothese und jedes Modells bei gleichzeitiger Echtzeitanalyse lebender und nicht lebender Systeme. Korrelationen werden wichtiger als kausale Erklärungsansätze, die sich oft erst später bewahrheiten oder falsifizieren lassen.

Hype, Schwammiger Begriff

Der Begriff „Big Data“ wird gelegentlich auch dann verwendet, wenn Daten weder groß noch komplex sind oder sich nicht schnell ändern oder mit herkömmlichen Techniken problemlos verarbeitet werden können. Die zunehmende Aufweichung des Begriffs führt dazu, dass er immer mehr ein aussageloser Marketingbegriff wird und vielen Prognosen zufolge innerhalb der nächsten Jahre eine starke Abwertung erfahren wird („Tal der Enttäuschungen“ im Hypezyklus).


(声明一下: wiki 是版权开放的自由百科。注释因不好粘贴,总有无法粘贴的图片问题,我会再考虑解决这个问题。所以请对这些wiki主题感兴趣的读者自行查阅文章相关注释。我本微信公众号的所有文章均是我写给大家的人文社科以及自然科学以及语言学习领域的初级普及类文章,以及我的工作生活教学感悟和经验和翻译及诗歌散文等作品。不是我的学术论文。——吕律德语老师)


    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多