منظور از "داده باز" چیست؟
اهمیت کنفرانس (IODC) یا همان کنفرانس جهانی داده باز (International Open Data Conference) چیست و اصلا از مفهوم «داده باز» و کاربردهایش چه می دانید؟
عنوان «داده باز»، به دادههايي اطلاق مي شود که به صورت رايگان و آزاد در اختيار همه قرار دارد تا بتوانند از آن استفاده کنند و به هر صورت و فرمت دلخواهی به نشر آن بپردازند.
«داده باز» داراي محدوديتهاي مربوط به حق کپي رایت، يا موارد محدودکننده مشابه آن نیست و مفاهيم مشابهي با ديگر جنبش هاي باز (Open)، نظير نرم افزارهای متن باز (Open Source) –درست مشابه آنچه در سیستم عامل اندروید شاهد آن هستیم- يا محتوای آزاد (Open Content) دارد.
داده چیست؟
امروزه همه چیز داده (Data) حساب میشود. از شنهای ریز سواحل گرفته تا منظومهها و سیارات کهکشانها.اما اصولا داده را مواد خامی میدانند که یک واقعیت را توصیف میکند. این مواد خام متغیرهای کمی(اعداد و..) یا کیفی(حروف و نمادها) هستند. وقتی دادهها کنار هم قرار گرفته و معنادار(پردازش) میشوند، در اینجا دیگر دادهی خام نیستند، بلکه به اطلاعات (Information) تبدیل شدهاند.
بهعنوان مثال دادههای انسان را در نظر بگیرید: رنگ پوست و مو و چشمها، نوع صورت، قد و اندازه، نام و نام و خانوادگی، شماره شناسنامه، کد ملی و.. که اطلاعات و مشخصات یک انسان حساب میشوند.
انواع داده چیست؟
•دادههای آمار و ارقام
•دادههای جغرافیایی
•دادههای حمل و نقل
•دادههای مالی و بانکی
•دادههای فرهنگی
•دادههای علمی
•دادههای آب و هوایی
•دادههای طبیعی و محیط زیستی
فراداده چیست؟
هر مطلبی که توضیحی راجعبه دادهها بدهد را فراداده (Meta Data) میگویند.فرادادهها یا در مشخصات فایل داده هستند، یا بهصورت جداگانه در صفحه دانلود و بخش توضیحات نوشته میشوند.فرادادهها معمولا شامل: منبع و تهیهکننده فایل داده، منتشرکننده داده، تاریخ تهیه و انتشار، تعاریف و مفاهیم، واحد اندازهگیری و.. میشود.
تفاوت داده با سند
بهعنوان مثال «مرکز آمار ایران»، آمار و اطلاعات خود را بهصورت فایل PDF و با توضیحات فراوان و مقدمه منتشر میکند. فایلهای فوق «داده» نیستند، بلکه یک «سند» برای مطالعه و آگاهی است.
بهاین دلیل که:
1.توضیحات و تحلیلهای مرکز را شامل شده است.
2.برای استفاده از دادههای موجود در آن اسناد، باید آنها را تایپ، ویرایش و آمادهسازی کرد.
در اینجا ما به چیزی میگوییم «داده» که در قالبهای صفحهگسترده یا جدولی آمده باشند، مثل فایلهای اکسل(XLS) و CSV.
مجموعه داده(دادگان) چیست؟
یک جدول که چند سطر و ستون داشته و ارقام و.. در آن ثبت شدهاند را یک مجموعه داده (Dataset) میگویند. بهصورت خلاصه، هر جدول داده یک دیتاست، دادگان یا مجموعه داده است.
داده بسته چیست؟
هر دادهای که برای دسترسی به آن محدودیت و هزینه وجود دارد را داده بسته (Closed Data)میگویند.
ویژگیهای داده بسته
اگر دادهای یک یا تعدادی از ویژگیهای زیر را داشته باشد، «بسته» حساب میشود.
•برای هر بار دسترسی به دادهها، مجوز و اجازهنامه لازم است.
•دادهها فقط برای اعضای یک گروه یا وبسایت نمایش داده میشوند.(یعنی برای دسترسی به داده یا باید عضو سایت شوید یا هزینهای را پرداخت کنید)
•دادهها رمزگذاری یا محدود شدهاند.
•دادهها شامل قانون کپیرایت میشوند. یعنی در هر بار استفاده از دادهها، نام منبع باید ذکر شود.
•موتورهای جستوجو، سایتها و API برای دسترسی به داده با محدودیت روبرو هستند.
•از نظر زمان استفاده میتوانند دارای محدودیت باشند.
•دادهها قابل تغییر و ترکیب نیستند.
•دادهها در فرمتهای گوناگونی ارائه نمیشوند.
داده باز چیست؟
طبق تعریف «راهنمای دادهباز»(Open Data Handbook):
داده باز، دادهای است که هر فردی میتواند بهصورت آزاد و رایگان از آن برای هر مقصودی بدون نیاز به مجوز یا اجازهنامه استفاده(استفاده مجدد، توزیع) کند.
ویژگیهای داده باز
هر دادهای که ویژگیهای داده بسته را نداشته باشد را میتوان یک داده باز دانست، یعنی:
1-در دسترس عموم باشد. 2-برای استفاده نیازی کسب به اجازه و مجوز نداشته باشد. 3-رایگان و بدون هزینه باشند. 4-در فرمتهای گوناگون(CSV, XLS) ارائه شود.5- بتوان آنها را ویرایش، ترکیب و بازاستفاده کرد.
فرق داده با داده باز
داده باز بر خلاف داده بسته، دسترسی عمومی دارد. پس اگر دادهای بر روی اینترنت برای همهی افراد و کاربران منتشر شده بود، آن داده باز است.
دادههای باز چه کاربردی دارند؟
سایت Open Street Map سایتی است که در آن کاربران آزادند، نقشه هر مکانی را ویرایش کنند و به کمک اطلاعات آزادی که همه کاربران دارند نقشهای از کل جهان روز به روز در حال تکمیل شدن است. اما اتفاق جالبی که در این سایت رخ داد مربوط به سال ۲۰۰۹ و زلزله هائیتی است. نقشه شهر پورتو پرنس در این کشور قبل از زلزله، نقشه دقیق و مناسبی مانند نقشه شهرهای بزرگ و پر جمعیت شناخته شده مانند نیویورک نبود. اما بلافاصله بعد از رخ دادن زلزله، شرکت تجاری GeoEye تصاویر ماهوارهای را از هائیتی را به عنوان داده باز برای استفاده همگان منتشر کرد و بلافاصله افراد مختلفی از سراسر جهان که امکان و توان نقشهکشی را داشتند با کمک این تصاویر ماهواره ای شروع به ویرایش نقشه این شهر در سایت Open Street Map نمودند و به سرعت این نقشه را ساختند. آنها به کمک قرار دادن نقطه های آبی رنگی بر روی نقشه محل استقرار و کمپ افراد آسیب دیده و بی سرپناه را مشخص کردند. این کار یک نقشه پویا، آنلاین و دقیق را به وجود آورد که بلافاصله محلهای استقرار افراد بی سرپناه را نشان می داد. در نتیجه این نقشه به سرعت به بهترین نقشه برای کسانی که عملیات امداد را در پورتو پرنس انجام می دادند، تبدیل شد و تیم های نجات از همین نقشه بر روی دستگاه های GPS خود استفاده می کردند. این نقشه به مرور تبدیل به یک نقشه فوق العاده از راههای مسدود شده، ساختمانهای آسیب دیده و حتی اقلام مورد نیاز تیمهای نجات و امداد در مناطق مختلف شد.
این فقط یک مثال بود که قدرت «داده باز» را به ما نشان میدهد. اما دادههای باز می تواند در شفافیت عملکرد دولتها نقش مهمی ایفا کنند و شرایط اجتماعی بسیار بهتری را برای شهروندان یک جامعه فراهم کند و اصطلاحا دولتها درون یک اتاق شیشهای قرارخواهند گرفت تا هم در سرعت عمل فرآیندهای اجرایی شاهد رشد و تسریع کارها باشیم، هم اینکه مواردی مانند فساد و رانت و… به شدت کاهش می یابد یعنی به نوعی این را هم میتوان گفت که داده های باز در شفافیت عملکرد اقتصادی دولت ها نیز نقش مهمی ایفا می کنند.
داده حکومتی باز
باید بدانیم که در حقیقت این «داده باز» باعث ایجاد مفاهیم جدیدی مثل دولت باز (Open Government) شده است و يکي از اصول هشتگانه دولت باز همین میزان دسترسی مردم به داده باز است که در زمینههای مختلف مالی، سلامت، حمل و نقل، انرژی، آموزش و … بطور بالقوه برآورد می شود که حدود ۳۰۰۰ تا ۵۰۰۰ میلیارد دلار ارزش اقتصادی را به همراه خواهد داشت.
البته بسترسازی برای «داده باز» اصولا باید توسط دولتها انجام شود تا بتوان ارزش استخراج شده توسط دادهها را به صورت واقعی مورد استفاده قرار داد.
آیا داده باز فقط برای دولتهاست؟
خیر. هر فردی یا شرکتی میتواند دادههای خود را بهصورت باز منتشر کند. زمانی که یک داده رایگان بوده و حق دسترسی عمومی داشته باشد آن باز محسوب میشود.
ویژگیهای داده حکومتی باز
•رایگان
•عمومی و بدون نیاز به مجوز
•بههنگام و بهروز بودن
•در فرمتهای گوناگون
•قابلیت استفاده مجدد
•ماشینخوان بودن
•قابل تغییر و ترکیب بودن
آمریکا و انگلیس صدر نشین داده باز
«بنیاد دانش باز» بریتانیا، شاخص دادههای باز و رابطه این شاخص با تولید ناخالص داخلی، شاخص توسعه انسانی و شاخص درک فساد را بر روی گروهی از کشورها مورد بررسی قرار داده است.در بررسی شاخص داده باز، دسترسی به اطلاعات در ۱۰ زمینه کلیدی زیر مورد بررسی قرار می گیرد:
•مخارج دولت
•بودجه دولت
•نتایج انتخابات
•جدول زمانی حمل و نقل
•میزان آلودگی
•ثبت شرکتها
•آمار ملی
•تصویب قانونها
•کدپستیها
•دسترسی به نقشه ملی
در این رتبه بندی که میان ۷۰ کشور مختلف انجام شد، انگلیس و آمریکا توانستند رتبههای نخست را به ترتیب کسب کنند. رتبههای بعدی به ترتیب به دانمارک، نروژ و هلند اختصاص داده شده است.
ایران و حرکت به سمت داده باز
ظرف چند سال گذشته شاهد آن هستیم که کشورمان نیز به سمت فعالیت در حوزه داده باز رفته است.از نمونه بسترهاي ایجاد شده در این خصوص مي توان به پرتالهاي «داده باز» اشاره کرد که در رویکرد نهادهای دولتی کشورمان آن شاهد هستیم تا پرتال های مختلفی در این حوزه در حال راه اندازی می باشد. اما برای مثال راه اندازی «درگاه دولت الکترونیک یا همان پنجره واحد خدمات دولت هوشمند» میتواند شروعی برای این فرآیند باشد یا حتی می توان به راه اندازی شبکه ملی اطلاعات که چندی پیش مراسم رونمایی فاز نخست آن برگزار شد اشاره کرد که به گفته مسئولین یکی از اهداف مهم آن زمینه سازی برای بروز و نمود بستر «داده باز» در کشورمان است.