اصول و استاندارد داده باز شهرستان مونتگمری

  • ۱۵ دی ۱۳۹۵
  • 2
  • بدون دیدگاه
  • نویسنده: نویسنده میهمان
  • لینک کوتاه:

شهرستان مونتگُمری واقع در ایالت آلابامای ایالات متحده، در سال ۲۰۱۳ برای ورود به بحث «داده باز» و انتشار داده‌های شهر خود برای عموم مردم، قاعده و اصولی را به عنوان راهنمای خود تدوین کرد. این اصول کلی عبارت‌انداز: ۱. […]

اصول و استاندارد داده باز شهرستان مونتگمری

شهرستان مونتگُمری واقع در ایالت آلابامای ایالات متحده، در سال ۲۰۱۳ برای ورود به بحث «داده باز» و انتشار داده‌های شهر خود برای عموم مردم، قاعده و اصولی را به عنوان راهنمای خود تدوین کرد.


این اصول کلی عبارت‌انداز:

۱. کامل: همه داده‌های عمومی باید در دسترس قرار بگیرند. داده‌های عمومی شامل همه چیز به غیر از: داده‌های حریم خصوصی معتبر، امنیتی و امتیازهای محدود می‌شود.

۲. به‌موقع: لازم است داده و به‌روزرسانی آن به سرعت در دسترس قرار داده شود تا ارزش آن حفظ شود. (یعنی داده به علت گذشت زمان اعتبار خود را از دست نداده و بی‌مصرف نشود.)

۳. بدون تبعیض: داده‌ها باید در دسترس همه و بدون نیاز به ثبت‌نام یا کسب اجازه باشد.

۴. رایگان: داده‌ها به عنوان یک حق عمومی، شامل قوانین کپی‌رایت، حق ثبت اختراع و.. نمی‌شوند.

۵. منبع: داده‌ها به عنوان یک مرجع جمع‌آوری می‌شوند، یعنی بایدبه  اعتبار و قابل استناد بودن آن‌ها توجه شود.(داده‌های جعلی، غلط، مشکوک، ناقص و مبهم ارائه نشوند.)

۶. در دسترس: داده‌ها برای اینکه معنی‌دار باشند باید ارایه شده و  در دسترس همگان قرار بگیرند. این کار به شفاف و همچنین فعال کردن راه‌حل‌های جدید و نوآورانه برای جامعه مفید است.

۷. ماشین‌خوان: داده‌ها را باید بتوان به‌صورت سیستمی و کامپیوتری پردازش کرد.

۸.غیراختصاصی: داده‌ها باید در بیش از یک فرمت(csv, pdf, xls) ارایه می‌شوند که تحت انحصار سازمان یا گروهی نباشند.

بعد از این اصول، استانداردهای داده آمده است که باید براساس موارد زیر، یک دیتاست یا مجموعه داده منتشر شود:

  • فرمت داده با پلتفرم مورد استفاده همخوانی داشته باشد.

به‌عنوان مثال وقتی قرار است داده‌ها تحلیل و بررسی شوند، نباید جداول داده با فرمت pdf‌ یا مایکروسافت ورد doc ارایه شوند.

  • داده‌ها باید در قطعات کوچک و ساختارمند ارایه شوند نه یک رشته بزرگ و بدون ساختار.

یعنی از متن‌های ساده اجتناب کرده و داده‌ها را به صورت عدد، زمان و.. در قالب سطر و ستون ارائه شوند.

  • برای داده‌های شامل آدرس و.. ، باید طول و عرض و مخصات جغرافیایی مکان هم ثبت شود.

وقتی شما از یک مکان یا محل سخن می‌گویید، باید داده‌ی جغرافیایی آن را هم اضافه کنید. مزیت این نکته زمانی روشن می‌شود که هنگام ماشین‌خوان کردن داده‌ها، محل فوق به صورت اتوماتیک مکان‌یابی می‌شود.

  • داده‌ها باید خام باشند.

تحلیل، نمودار و.. نباید همراه با اصل داده ارائه شود. این موارد جزء اصلی داده نیستند.

  • تا حد امکان داده‌ها به‌صورت فرمت CSV ارائه شود تا فرمول‌ها و محتواهای اضافی اکسل در آن ثبت نشوند.

در فرمت csv ، داده‌ها به صورت متنی اما در قالب ستون‌های مجزا از طریق ویرگول جدا شده که خواندن آن‌ها توسط ماشین و سایر نرم‌افزارها آسان بوده و می‌توان آن را به دیگر فرمت‌ها تبدیل کرد.

  • پاورقی و اطلاعات استنادی باید قبل از آپلود از داده‌ها حذف شوند.

اگر تیترها و سایر توضیحات اضافی حذف نشوند، در تبدیل سند به فرمت csv و خواندن آن مشکل به وجود خواهد آمد.

در گراف زیر می‌توانید خلاصه‌ای از اصول داده این شهرستان را دانلود نمایید.