آمار
آمار

آمار (به انگلیسی: statistics) به مجموعه‌ی داده‌های عددی مربوط به یک موضوع (معمولا مهم)، مانند جمعیت، متوفیات، میزان تجارت داخلی یا خارجی، دما یا بارش ماهیانه و غیر گفته می‌شود. آمار را باید علم و عمل استخراج، بسط، و توسعهٔ دانشهای تجربی انسانی با استفاده از روش‌های گردآوری، تنظیم، پرورش، و تحلیل دادههای تجربی (حاصل از اندازه گیری و آزمایش) دانست.





زمینه‌های محاسباتی و رایانه‌ای جدیدتری همچون یادگیری ماشینی، و کاوش‌های ماشینی در داده‌ها، در واقع، امتداد و گسترش دانش گسترده و کهن از آمار به عهد محاسبات نو و دوران اعمال شیوه‌های ماشینی در همه‌جا می‌باشد. علم آمار، علم فن فراهم کردن داده‌های کمّی و تحلیل آن‌ها به منظور به دست آورن نتیایجی که اگرچه احتمالی است، اما در خور اعتماد است.


در صورتی که شاخه‌ای علمی مد نظر نباشد، معنای آن، داده‌هایی به‌شکل ارقام و اعداد واقعی یا تقریبی است که با استفاده از علم آمار می‌توان با آن‌ها رفتار کرد و عملیات ذکر شده در بالا را بر آن‌ها انجام داد. بیشتر مردم با کلمة آمار به مفهومی که برای ثبت و نمایش اطلاعات عددی به کار می‌رود آشنا هستند. ولی این مفهوم منطبق با موضوع اصلی مورد بحث آمار نیست. آمار عمدتاً با وضعیتهایی سر و کار دارد که در آنها وقوع یک پیشامد به طور حتمی قابل پیش بینی نیست. اسنتاجهای آماری غالباً غیر حتمی اند، زیرا مبتنی بر اطلاعات ناکاملی هستند. در طول چندین دهه آمار فقط با بیان اطلاعات و مقادیر عددی در باره اقتصاد، جمعیت‌شناسی و اوضاع سیاسی حاکم در یک کشور سر و کار داشت. حتی امروز بسیاری از نشریات و گزارشهای دولتی که توده‌ای از آمار و ارقام را در بردارند معنی اولیه کلمه آمار را در ذهن زنده می‌کنند. اکثر افراد معمولی هنوز این تصویر غلط را در باره آمار دارند که آن را منحصر به ستونهای عددی سرگیجه آور و گاهی یک سری شکلهای مبهوت کننده می‌دانند. بنابراین، یادآوری این نکته ضروری است که نظریه و روشهای جدید آماری از حد ساختن جدولهای اعداد و نمودارها بسیار فراتر رفته‌اند. آمار به عنوان یک موضوع علمی، امروزه شامل مفاهیم و روشهایی است که در تمام پژوهشهایی که مستلزم جمع آوری داده‌ها به وسیله یک فرایند آزمایش و مشاهده و انجام استنباط و نتیجه گیری به وسیله تجزیه و تحلیل این داده‌ها هستند اهمیت بسیار دارند.






علم آمار

علم آمار، خود مبتنی است بر نظریه آمار که شاخه‌ای از ریاضیات کاربردی به حساب می‌آید. در نظریهٔ آمار، اتفاقات تصادفی و عدم قطعیت توسط نظریهٔ احتمالات مدل‌سازی می‌شوند. در این علم، مطالعه و قضاوت معقول در بارهٔ موضوع‌های گوناگون، بر مبنای یک جمع انجام می‌شود و قضاوت در مورد یک فرد خاص، اصلاً مطرح نیست.

از جملهٔ مهم‌ترین اهداف آمار، می‌توان تولید «بهترین» اطّلاعات از دادههای موجود و سپس استخراج دانش از آن اطّلاعات را ذکر کرد. به همین سبب است که برخی از منابع، آمار را شاخه‌ای از نظریه تصمیم‌ها به شمار می‌آورند.

این علم به بخش‌های آمار توصیفی و آمار استنباطی تقسیم می‌شود. از طرف دیگر می‌توان آن را به دو بخش آمار کلاسیک و آمار بیز تقسیم بندی کرد. در آمار کلاسیک، که امروزه در دانشگاه‌ها و دبیرستان‌ها تدریس می‌گردد، ابتدا آزمایش و نتیجه را داریم و بعد بر اساس آن‌ها فرض‌ها را آزمون می‌کنیم. به عبارت دیگر ابتدا آزمایش انجام می‌شود و بعد فرض آزمون می‌گردد. در آمار بیزی ابتدا فرض در نظر گرفته می‌شود و داده‌ها با آن مطابقت داده می‌شوند به عبارت دیگر در آمار بیزی یک پیش توزیع داریم-توزیع پیشین- و بعد از مطالعه داده‌ها و برای رسیدن به آن توزیع پیشین، توزیع پسین را در نظر می‌گیریم.






علم آماری

شامل برنامه‌ریزی و جمع‌بندی و تفسیر مشاهدات غیر قطعی است به‌شکلی که∗:

اعداد نمایندهٔ واقعی مشاهدات بوده، غیر واقعی یا غلط نباشند.
به‌نحو مفیدی تهیه و تنظیم شوند.
به‌نحو صحیح تحلیل شوند.
قابل نتیجه‌گیری صحیح باشند.







روش‌های آماری

مطالعات تجربی و مشاهداتی هدف کلی برای یک پروژه تحقیقی آماری، بررسی حوادث اتفاقی بوده و به ویژه نتیجه گیری روی تأثیر تغییرات در ارزش شاخص‌ها یا متغیرهای غیر وابسته روی یک پاسخ یا متغیر وابسته‌است. دو شیوه اصلی از مطالعات آماری تصادفی وجود دارد: مطالعات تجربی و مطالعات مشاهداتی. در هر دو نوع از این مطالعات، اثر تغییرات در یک متغیر (یا متغیرهای) غیر وابسته روی رفتار متغیرهای وابسته مشاهده می‌شود. اختلاف بین این دو شیوه درچگونگی مطالعه‌ای است که عملاً هدایت می‌شود. یک مطالعه تجربی در بردارنده روش‌های اندازه گیری سیستم تحت مطالعه‌است که سیستم را تغییر می‌دهد و سپس با استفاده از روش مشابه اندازه گیری‌های اضافی انجام می‌دهد تا مشخص سازد که آیا تغییرات انجام شده، مقادیر شاخص‌ها را تغییر می‌دهد یا خیر. در مقابل یک مطالعه نظری، مداخلات تجربی را در بر نمی‌گیرد. در عوض دادهها جمع آوری می‌شوند و روابط بین پیش بینی‌ها و جواب بررسی می‌شوند.

یک نمونه از مطالعه تجربی، مطالعات Hawthorne مشهور است که تلاش کرد تا تغییرات در محیط کار را در کمپانی الکتریک غربی Howthorne بیازماید. محققان علاقه مند بودند که آیا افزایش نور می‌تواند کارایی را در کارگران خط تولید افزایش دهد. محققان ابتدا کارایی را در کارخانه اندازه گیری کردند و سپس میزان نور را در یک قسمت از کارخانه تغییر دادند تا مشاهده کنند که آیا تغییر در نور می‌تواند کارایی را تغییر دهد. به واسطه خطا در اقدامات تجربی، به ویژه فقدان یک گروه کنترل محققاتی در حالی که قادر نبودند آنچه را که طراحی کرده بودند، انجام دهند قادر شدند تا محیط را با شیوه Hawthorne آماده سازند. یک نمونه از مطالعه مشاهداتی، مطالعه ایست که رابطه بین سیگار کشیدن و سرطان ریه را بررسی می‌کند. این نوع از مطالعه به طور اختصاصی از شیوه‌ای استفاده می‌کند تا مشاهدات مورد علاقه را جمع آوری کند و سپس تجزیه و تحلیل آماری انجام دهد. در این مورد، محققان مشاهدات افراد سیگاری و غیر سیگاری را جمع آوری می‌کنند و سپس به تعداد موارد سرطان ریه در هر دو گروه توجه می‌کنند.






احتمالات

در زبان محاوره، احتمال یکی از چندین واژه‌ای است که برای دانسته یا پیشامدهای غیر مطمئن به کار می‌رود و کم و بیش با واژه‌هایی مانند ریسک، خطرناک، نامطمئن، مشکوک و بسته به متن قابل معاوضه‌است. شانس، بخت، امتیاز و شرط بندی از لغات دیگری است که نشان دهنده برداشت‌های مشابهی است. همانگونه که نظریه مکانیک به تعاریف دقیق ریاضی از عبارات متداولی مثل کار و نیرو می‌پردازد، نظریه احتمالات نیز تلاش دارد تا مفاهیم و برداشت‌های مربوط به احتمالات را کمّی سازی کند.






نرم‌افزارها

آمار مدرن برای انجام بعضی از محاسبات خیلی پیچیده و بزرگ به وسیله رایانهها استفاده می‌شود. کل شاخه‌های آمار با استفاده از محاسبات کامپیوتری انجام‌پذیر شده‌اند، برای مثال شبکه‌های عصبی. انقلاب کامپیوتری با یک توجه نو به آمار «آزمایشی» و «شناختیک» رویکردهایی برای آینده آمار داشته‌است.

یکی از مهم‌ترین کاربردهای آمار و احتمال با استفاده از رایانه شبیه سازی است.

شبیه سازی نسخه‌ای از بعضی وسایل حقیقی یا موقعیت‌های کاری است. شبیه سازی تلاش دارد تا بعضی جنبه‌های رفتاری یک سیستم فیزیکی یا انتزاعی را به وسیله رفتار سیستم دیگری نمایش دهد. شبیه سازی در بسیاری از متون شامل مدل سازی سیستم‌های طبیعی و سیتم‌های انسانی استفاده می‌شود. برای به دست آوردن بینش نسبت به کارکرد این سیستم‌ها در تکنولوژی و مهندسی ایمنی که هدف، آزمون بعضی سناریوهای عملی در دنیای واقعی است از شبیه سازی استفاده می‌شود. در شبیه سازی با استفاده از یک شبیه ساز یا وسیله دیگری در یک موقعیت ساختگی می‌توان آثار واقعی بعضی شرایط احتمالی را بازسازی کرد.







۱- شبیه سازی فیزیکی و متقابل (شبیه سازی فیزیکی، به شبیه سازی اطلاق می‌شود که در آن اشیای فیزیکی به جای شی واقعی جایگزین می‌شوند و این اجسام فیزیکی اغلب به این خاطر استفاده می‌شوند که کوچک‌تر و ارزان تر از شی یا سیستم حقیقی هستند. شبیه سازی متقابل (تعاملی) که شکل خاصی از شبیه سازی فیزیکی است و غالباً به انسان در شبیه سازی‌های حلقه‌ای اطلاق می‌شود یعنی شبیه سازی‌های فیزیکی که شامل انسان می‌شوند مثل مدل استفاده شده در شبیه ساز پرواز.)







۲- شبیه سازی در آموزش (شبیه سازی اغلب در آموزش پرسنل شهری و نظامی استفاده می‌شود. معمولاً هنگامی رخ می‌دهد که استفاده از تجهیزات در دنیای واقعی از لحاظ هزینه کمرشکن یا بسیار خطرناک است تا بتوان به کارآموزان اجازه استفاده از آن‌ها را داده. در چنین موقعیت‌هایی کارآموزان وقت خود را با آموزش دروس ارزشمند در یک محیط واقعی «ایمن» می‌گذرانند. غالباً این اطمینان وجود دارد تا اجازه خطا را به کارآموزان در طی آموزش داد تا ارزیابی سیستم ایمنی– بحران صورت گیرد.)

شبیه سازی‌های آموزشی به طور خاص در یکی از چهار گروه زیر قرار می‌گیرند:

الف - شبیه سازی زنده (جایی که افراد واقعی از تجهیزات شبیه سازی شده (یا آدمک) در دنیای واقعی استفاده می‌کنند.)

ب - شبیه سازی مجازی (جایی که افراد واقعی از تجهیزات شبیه سازی شده در دنیای شبیه سازی شده (یا محیط واقعی) استفاده می‌کنند.) یا

ج - شبیه سازی ساختاری (جایی که افراد شبیه سازی شده از تجهیزات شبیه سازی شده در یک محیط شبیه سازی شده استفاده می‌کنند. اغلب به عنوان بازی جنگی نامیده می‌شود زیرا که شباهتهایی با بازی‌های جنگی رومیزی دارد که در آن‌ها بازیکنان، سربازان و تجهیزات را اطراف یک میز هدایت می‌کنند.)

د - شبیه سازی ایفای نقش (جایی که افراد واقعی نقش یک کار واقعی را بازی می‌کنند.)







۳ - شبیه سازی‌های پزشکی (شبیه سازهای پزشکی به طور فزاینده‌ای در حال توسعه و کاربرد هستند تا روشهای درمانی و تشخیص و همچنین اصول پزشکی و تصمیم گیری به پرسنل بهداشتی آموزش داده شود. طیف شبیه سازها برای آموزش روش‌ها از پایه مثل خونگیری تا جراحی لاپاراسکوپی و مراقبت از بیمار دچار ضربه، وسیع و گسترده‌است. بسیاری از شبیه سازهای پزشکی دارای یک رایانه هستند که به یک ماکت پلاستیکی با آناتومی مشابه واقعی متصل است. در بعضی از آنها، ترسیم‌های کامپیوتری تمام اجزای قابل رؤیت را به دست می‌دهد و با دستکاری در دستگاه می‌توان جنبه‌های شبیه سازی شده کار را تولید کرد. بعضی از این دستگاهها دارای شبیه سازهای گرافیکی رایانهای برای تصویربرداری هستند مانند پرتو ایکس یا سایر تصاویر پزشکی. بعضی از شبیه سازهای بیمار، دارای یک مانکن انسان نما هستند که به داروهای تزریق شده واکنش می‌دهد و می‌توان آن را برای خلق صحنه‌های مشابه فوریت‌های پزشکی خطرناک برنامه ریزی کرد. بعضی از شبیه سازهای پزشکی از طریق شبکه اینترنت قابل گسترش هستند و با استفاده از جستجوگرهای استاندارد شبکه به تغییرات جواب می‌دهند. در حال حاضر، شبیه سازی‌ها به موارد غربال گری پایه محدود شده‌اند به نحوی که استفاده کنندگان از طریق وسایل امتیازدهی استاندارد با شبیه سازی در ارتباط هستند.)







۴ - شبیه سازهای پرواز (یک شبیه ساز پرواز برای آموزش خلبانان روی زمین مورد استفاده قرار می‌گیرد. به خلبان اجازه داده می‌شود تا به هواپیمای شبیه سازی شده اش آسیب برساند بدون آن که خود دچار آسیب شود. شبیه سازهای پرواز اغلب برای آموزش خلبانان استفاه می‌شوند تا هواپیما را در موقعیت‌های بسیار خطرناک مثل زمین نشستن بدون داشتن موتور یا نقص کامل الکتریکی یا هیدرولیکی هدایت کنند. پیشرفته‌ترین شبیه سازها دارای سیستم بصری با کیفیت بالا و سیستم حرکت هیدرولیک هستند. کار با شبیه ساز به طور معمول نسبت به هواپیمای واقعی ارزان تر است.)







۵ - شبیه سازی و بازیها (هم چنین بسیاری از بازی‌های ویدئویی شبیه ساز هستند که به طور ارزان تر آماده سازی شده‌اند. بعضی اوقات از این‌ها به عنوان بازیهای شبیه سازی (sim) نامبرده می‌شود. چنین بازیهایی جنبه‌های گوناگون واقعی را شبیه سازی می‌کنند از اقتصاد گرفته تا وسایل هوانوردی مثل شبیه سازهای پرواز.)







۶ - شبیه سازی مهندسی (شبیه سازی یک مشخصه مهم در سیستم‌های مهندسی است. برای مثال در مهندسی برق، از خطوط تأخیری استفاده می‌شود تا تأخیر تشدید شده و شیفت فاز ناشی از خط انتقال واقعی را شبیه سازی کنند. مشابهاً، از بارهای ظاهری می‌توان برای شبیه سازی مقاومت بدون شبیه سازی تشدید استفاده کرد و از این حالت در مواقعی استفاده می‌شود که تشدید ناخواسته باشد. یک شبیه ساز ممکن است تنها چند تا از کارکردهای واحد را شبیه سازی کند که در مقابل با عملی است که تقلید نامیده می‌شود.






۷ - اغلب شبیه سازی‌های مهندسی مستلزم مدل سازی ریاضی و بررسی‌های کامپیوتری هستند. به هر حال موارد زیادی وجود دارد که مدل سازی ریاضی قابل اعتماد نیست. شبیه سازی مشکلات مکانیک سیالات اغلب مستلزم شبیه سازی‌های ریاضی و فیزیکی است. در این موارد، مدل‌های فیزیکی نیاز به شبیه سازی دینامیک دارند.)







۸ - شبیه سازی کامپیوتری (شبیه سازی رایانه، جزو مفیدی برای بسیاری از سیستم‌های طبیعی در فیزیک، شیمی و زیست‌شناسی و نیز برای سیستم‌های انسانی در اقتصاد و علوم اجتماعی (جامعه‌شناسی کامپیوتری) و همچنین در مهندسی برای به دست آوردن بینش نسبت به عمل این سیستم‌ها شده‌است. یک نمونه خوب از سودمندی استفاده از رایانه‌ها در شبیه سازی را می‌توان در حیطه شبیه سازی ترافیک شبکه جستجو کرد. در چنین شبیه سازی‌هایی رفتار مدل هر شبیه سازی را مطابق با مجموعه پارامترهای اولیه منظور شده برای محیط تغییر خواهد داد. شبیه سازی‌های کامپیوتری اغلب به این منظور به کار گرفته می‌شوند تا انسان از شبیه سازی‌های حلقه‌ای در امان باشد. به طور سنتی، مدل برداری رسمی سیستم‌ها از طریق یک مدل ریاضی بوده‌است به نحوی که تلاش در جهت یافتن راه حل تحلیلی برای مشکلات بوده‌است که پیش بینی رفتار سیستم را با استفاده از یک سری پارامترها و شرایط اولیه ممکن ساخته‌است. شبیه سازی کامپیوتری اغلب به عنوان یک ضمیمه یا جانشین برای سیستم‌های مدل سازی است که در آن‌ها راه حل‌های تحلیلی بسته ساده ممکن نیست. انواع مختلفی از شبیه سازی کامپیوتری وجود دارد که وجه مشترک همه آن‌ها در این است که تلاش می‌کند تا یک نمونه از برنامه‌ای برای یک مدل تولید کنند که در آن امکان محاسبه کامل تمام حالات ممکن مدل مشکل یا غیر ممکن است.)

به طور رو به افزونی معمول شده‌است که نام انواع مختلفی از شبیه سازی شنیده می‌شود که به عنوان «محیط‌های صناعی» اطلاق می‌شوند. این عنوان اتخاذ شده‌است تا تعریف شبیه سازی عملاً به تمام دستاوردهای حاصل از رایانه تعمیم داده شود.







۹ - شبیه سازی در علم رایانه (در برنامه نویسی کامپیوتری، یک شبیه ساز اغلب برای اجرای برنامه‌ای مورد استفاده قرار می‌گیرد که انجام آن برای رایانه با مقداری دشواری همراه است. برای مثال، شبیه سازها معمولاً برای رفع عیب یک ریزبرنامه استفاده می‌شوند. از آن جایی که کار کامپیوتر شبیه سازی شده‌است، تمام اطلاعات در مورد کار رایانه مستقیماً در دسترس برنامه دهنده‌است و سرعت و اجرای شبیه سازی را می‌توان تغییر داد. همچنین شبیه سازها برای تفسیر درخت‌های عیب یا تست کردن طراحی‌های منطقی VLSI قبل از ساخت مورد استفاده قرار می‌گیرند. در علم رایانه نظریه، عبارت شبیه سازی نشان دهنده یک رابطه بین سیستم‌های انتقال وضعیت است که این در مطالعه مفاهیم اجرایی سودمند است.)







۱۰ - شبیه سازی در تعلیم و تربیت (شبیه سازی‌ها در تعلیم و تربیت گاهی مثل شبیه سازی‌های آموزشی هستند. آن‌ها روی وظایف خاص متمرکز می‌شوند. در گذشته از ویدئو برای معلمین و دانش آموزان استفاده می‌شود تا مشاهده کنند، مسائل را حل کنند و نقش بازی کنند؛ هرچند، یک استفاده جدید تر از شبیه سازی‌ها در تعلیم و تربیت شامل فیلم‌های انیمیشن است (ANV.(ANVها نوعی فیلم ویدئویی کارتون مانند با داستان‌های تخیلی یا واقعی هستند که برای آموزش و یادگیری کلاس استفاده می‌شوند.ANVها برای ارزیابی آگاهی، مهارت‌های حل مسئله و نظم بچه‌ها و معلمین قبل و حین اشتغال کارایی دارند.)

شکل دیگری از شبیه سازی در سال‌های اخیر با اقبال در آموزش بازرگانی مواجه شده‌است. شبیه سازی بازرگانی که دارای یک مدل پویا است که آزمون استراتژی‌های بازرگانی را در محیط فاقد خطر مهیا می‌سازد و محیط مساعدی برای مباحث مطالعه موارد ارائه می‌دهد.







واژگانی که درک مفهوم آن‌ها در علم آمار مهم است عبارت‌اند از∗:

جمعیت
نمونه
متغیّر
مقیاس‌های اندازه‌گیری:
مقیاس اسمی (به انگلیسی: Nominal Scale)
مقیاس ترتیبی (به انگلیسی: Ordinal Scale)
مقیاس فاصله‌ای (به انگلیسی: Interval Scales)
مقیاس نسبی (به انگلیسی: Ratio Scales)

آمار رشته وسیعی از ریاضی است که راههای جمع آوری، خلاصه سازی و نتیجه گیری از دادهها را مطالعه می‌کند. این علم برای طیف وسیعی از علوم دانشگاهی از فیزیک و علوم اجتماعی گرفته تا انسان‌شناسی و همچنین تجارت، حکومت داری و صنعت کاربرد دارد.

هنگامی که دادهها جمع آوری شدند چه از طریق یک روش نمونه برداری خاص یا به وسیله ثبت پاسخ‌ها در قبال رفتارها در یک مجموعه آزمایشی (طرح آزمایش) یا به وسیله مشاهده مکرر یک فرایند در طی زمان (سری‌های زمانی) خلاصه‌های گرافیکی یا عددی را می‌توان با استفاده از آمار توصیفی به دست آورد.

الگوهای موجه در داده‌ها سازمان بندی می‌شوند تا نتیجه گیری در مورد جمعیت‌های بزرگ‌تر به دست آید که این کار با استفاده از آمار استنباطی صورت می‌گیرد و تصادفی بودن و عدم قاطعیت در مشاهدات را شناسایی می‌کند. این استنباط‌ها ممکن است به شکل جوابهای بله یا خیر به سؤالات باشد (آزمون فرض)، خصوصیات عددی را برآورد کند (تخمین)، پیش گویی مشاهدات آتی باشد، توصیف ارتباط‌ها باشد (همبستگی) و یا مدل سازی روابط باشد (رگرسیون).

شبکه توصیف شده در بالا گاهی اوقات به عنوان آمار کاربردی اطلاق می‌شود. در مقابل، آمار ریاضی (یا ساده تر نظریه آماری) زیر رشته‌ای از ریاضی کاربردی است که از نظریه احتمال و آنالیز برای به کارگیری آمار برروی یک پایه نظریه محکم استفاده می‌کند.







مراحل پایه برای انجام یک تجربه عبارت‌اند از:

برنامه ریزی تحقیق شامل تعیین منابع اطلاعاتی، انتخاب موضوع تحقیق و ملاحظات اخلاقی برای تحقیق و روش پیشنهادی. طراحی آزمون شامل تمرکز روی مدل سیستم و تقابل متغیرهای مستقل و وابسته. خلاصه سازی از نتایج مشاهدات برای جامعیت بخشیدن به آنها با حذف نتایج (آمار توصیفی). رسیدن به اجماع در مورد آنچه مشاهدات درباره دنیایی که مشاهده می‌کنیم به ما می‌گویند (استنباط آماری). ثبت و ارائه نتایج مطالعه.






سطوح اندازه گیری

چهار نوع اندازه گیری یا مقیاس اندازه گیری در آمار استفاده می‌شود. چهار نوع یا سطح اندازه گیری (ترتیبی، اسمی، بازه‌ای و نسبی) دارای درجات متفاوتی از سودمندی در بررسی‌های آماری دارند. اندازه گیری نسبی در حالی که هم یک مقدار صفر و فاصله بین اندازه‌های متفاوت تعریف می‌شود بیشترین انعطاف پذیری را در بین روش‌های آماری دارد که می‌تواند برای تحلیل داده‌ها استفاده شود. مقیاس تناوبی با داشتن فواصل معنی دار بین اندازه‌ها اما بدون داشتن میزان صفر معنی دار (مثل اندازه‌گیری بهره هوشی یا اندازه‌گیری دما در مقیاس سلسیوس) در تحقیقات آماری استفاده می‌شود. صفت آماری - هر ویژگی مربوط به هر واحد جامعه را یک صفت آماری یا به اختصار یک صفت برای آن واحد آماری است. اگر یک واحد آماری یک انسان باشد، گروه خون، وزن، میزان سواد، میزان درآمد، درجه حرارت بدن و تعدادخانوار هر کدام یک صفت آماری برای آن واحد است. صفتهای آماری دو دسته کلی هستند. ۱- صفت مشخصه ۲ صفت متغیر





میانه‌ها و شاخص‌های آماری
میانه‌ها وشاخص‌های آماری ترتیبی

iامین شاخص آمار ترتیبی یک مجموعه n عضوی، iامین عضو کوچک است. به عنوان مثال، مینیمم یک مجموعه از اعضا، اولین شاخص آمار ترتیبی (i=۱)است و ماکزیمم، nامین شاخص آمار ترتیبی (i=n)است. میانه، به طور غیر رسمی، نقطهٔ میانی مجموعه‌است. هنگامی که n فرد است، میانه منحصر به فرد است که در i=(n+۱)/۲ رخ می‌دهد. وقتی n زوج است، دو میانه وجود دارند که در i=n/۲ و i=n/۲+۱ رخ می‌دهند. انتخاب iامین شاخص آمار ترتیبی از یک مجموعه با n عضو مجزا را بیان می‌کند. مسئله انتخاب می‌تواند به طور رسمی به شکل زیر تعیین شود: ورودی: مجموعه A با n عدد(مجزا) و عدد i، که i بزرگتر یا مساوی ۱ و کوچکتر یا مساوی با n است. خروجی: عضو x در A که بزرگتر از دقیقا i-۱ عضو دیگر A می‌باشد. مسئله انتخاب می‌تواند در زمان (O(nlgn حل شود، چون می‌توانیم اعداد را با استفاده از مرتب سازی دودویی (heap sort) یا مرتب سازی ادغام مرتب کنیم و سپس به سادگی iامین عنصر در آرایه خروجی را مشخص کنیم اما الگوریتم‌های سریع تری وجود دارند. ابتدا مسئله انتخاب مینمم و ماکزیمم یک مجموعه از اعضا را بررسی می‌کنیم. مسئله جالب تر، مسئله انتخاب کلی است، که دردوقسمت بررسی می‌شود.قسمت اول یک الگوریتم عملی را تحلیل می‌کند که در حالت میانگین به زمان اجرای (O(n می‌رسد. قسمت بعد یک الگوریتم است که جنبه‌های نظری بیشتری داشته و در بدترین حالت به زمان اجرای (O(n می‌رسد.






مینیمم و ماکزیمم

چه تعداد مقایسه برای تعیین یک مجموعه n عضوی لازم است؟ می‌توانیم به سادگی به حد بالای n-۱ برای مقایسه‌ها برسیم: هر عضو مجموعه را به ترتیب بررسی کرده و کوچکترین عضوی که تا کنون دیده شده‌است را نگه می‌داریم. در روال زیر، فرض می‌کنیم مجموعه در آرایه A قرار دارد، که طول آرایه n است. قطعا یافتن ماکزیمم می‌تواند با n-۱ مقایسه نیز انجام شود. آیا این بهترین کاری است که می‌توانیم انجام دهیم؟ بله، چون می‌توانیم به حد پایین n-۱ برا مقایسه‌ها برای مینممم برسیم. الگوریتم را در نظر بگیرید که مینیمم را به صورت مسابقه‌ای بین عناصر تعیین می‌کند. هر مقایسه یک بازی در مسابقه‌است که در آن عنصر کوچکتر از میان دو عنصر، برنده می‌شود. نگرش اصلی این است که هر عنصر به جز برنده باید حداقل یک بازی را ببازد. از این رو n-۱ مقایسه برای تعیین مینیمم لازم است.






مینیمم و ماکزیمم هم زمان

در برخی کاربردها، باید هم مینیمم و هم ماکزیمم یک مجموعه از n عضو را پیدا کنیم. ارائه الگوریتمی که بتواند هم مینیمم و هم ماکزیمم n عضو را با استفاده از (θ(nمقایسه، که به طور مجانبی بهینه‌است، پیدا کند سخت نیست. به سادگی مینیمم و ماکزیمم را به طور مستقل، با استفاده از n-۱ مقایسه برای هر یک پیدا می‌کند، که در کل ۲n-۲ مقایسه انجام می‌دهد. در حقیقت، حداکثر ۳n/۲ مقایسه برای پیدا کردن مینیمم و ماکزیمم کافی است. استراتژی این است که اعضای مینیمم و ماکزیمم را که تا این جا دیده شده‌اند نگه داریم. به جای این که هر عضو ورودی را با مقایسه با مینیمم و ماکزیمم فعلی پردازش کنیم، که هزینه ۲ مقایسه برای هر عضو را صرف می‌کند، اعضا را جفت به جفت مقایسه می‌کنیم. ابتدا جفت عضوها را از ورودی با یکدیگر مقایسه می‌کنیم و سپس عضو کوچکتر را با مینیمم جاری و عضو بزرگتر را با ماکزیمم جاری مقایسه می‌کنیم که هزینه ۳ مقایسه برای هر دو عضو را موجب می‌شود.






انتخاب در زمان خطی مورد انتظار

مسئله انتخاب کلی نسبت به مسئله پیدا کردن یک مینیمم سخت تر به نظر می‌آیدو هم چنان که به صورت شگفت آوری زمان اجرای مجانبی هر دو مسئله یکی است: (θ(n.در این بخش یک الگوریتم تقسیم و حل را برای مسئله انتخاب ارائه می دهیم. الگوریتم Randomized-Select بعد از الگوریتم مرتب سازی سریع مدل می‌شود. همانند مرتب سازی سریع ایده آن است که آرایه ورودی را به طور بازگشتی تقسیم کنیم. ولی برخلاف مرتب سازی سریع که هر دو طرف تقسیم بندی را به صورت بازگشتی پردازش می‌کند، Randomized-Select فقط روی یک طرف تقسیم بندی عمل می‌کند. این تفاوت در تحلیل آشکار می‌شود. در حالی که زمان اجرای مورد انتظار مرتب سازی سریع (θ(nlgn است، زمان مورد انتظار این الگوریتم (θ(nاست. Randomized-Select از روال Randomized-Partition که در بخش مرتب سازی سریع معرفی شد استفاده می‌کند.

این الگوریتم iامین عنصر کوچک آرایه Ap..r را برمی گرداند. بعد از این که Randomized-Partition در خط 3 الگوریتم اجرا می‌شود، آرایهAp..r به دو زیر آرایه (شاید خالی)Ap..q-1و Aq+1..rتقسیم می‌شود. به طوری که هر عنصرAp..q-1 کوچک تر یا مساوی با Aqاست که Aqنیز به نوبهٔ خود کوچک تر از هر عنصری ازAq+1..r می‌باشد. همانند مرتب سازی سریع، به Aq به عنوان عنصر محوری(pivot)اشاره می کنیم. خط 4 از Randomized-Select تعداد k عناصر در زیر آرایه Ap..q-1را محاسبه می‌کند، به عبارت دیگر تعداد عناصر در طرف کم تر تقسیم بندی، به علاوه 1 برای عنصر محوری. سپس خط 5 چک می‌کندکه آیi Aq امین عنصر کوچک هست یا نه.اگر باشد آن گاهAq برگردانده می‌شود. در غیر این صورت، الگوریتم تعیین می‌کند که iامین عنصر کوچک در کدام یک از دو زیر آریه قرار دارد. زمان اجرای Randomized-Select در بدترین حالت (θ(n^2است. اگر چه الگوریتم به خوبی در حالت میانگین کار می‌کند و چون تصادفی است، هیچ ورودی خاصی باعث رفتار بدترین حالت نمی‌شود.






انتخاب در بدترین حالت زمان خطی

اکنون الگوریتمی را بررسی می کنیم که زمان اجرای آن در بدترین حالت (O(nاست. مانند Randomized-Select، الگوریتم Select عنصر مورد نظر را با تقسیم بندی بازگشتی آرایه ورودی پیدا می‌کند. اما ایده‌ای که پشت این الگوریتم وجود دارد، این است که یک قسمت خوب را در هنگامی که آرایه تقسیم می‌شود تضمین می‌کند. Select از الگوریتم تقسیم بندی قطعی Partition مربوط به مرتب سازی سریع استفاده می‌کند که طوری تغییر یافته است که عنصری که تقسیم بندی حول آن انجام می‌شود را به عنوان پارامتر ورودی بگیرد. این الگوریتم iامین عنصر کوچک از آرایه ورودی با n>1 عنصر را با اجرای مراحل زیر تعیین می‌کند.(اگر n=1باشد آن گاه Select به طور مطلق، تنها ورودیش را به عنوان iامین عنصر کوچک برمی گرداند.)

n عنصرآرایه ورودی را بهn/5 گروه 5 عنصری تقسیم کنید و حداکثر یک گروه از n mod 5 عنصر باقیمانده ساخته می‌شود.
میانه هر یک از n/5گروه را ابتدا با مرتب ساز درجی عناصر هر گروه (که حداکثر 5 عنصر در هر یک وجود دارد)و سپس انتخاب میانه از لیست مرتب شده عناصر گروه پیدا کنید.
از Select به صورت بازگشتی برای پیدا کردن میانه x از n/5میانه‌ای که در مرحله 2 پیدا شدند استفاده کنید.
آرایه ورودی را حول میانهٔ میانه‌ها (یعنی x)با استفاده از نسخه تغییر یافته Partition تقسیم کنید. فرض کنید k یک واحد بیشتر از تعداد عناصر در طرف کم تر تقسیم بندی باشد، بنابراین k، x امین عنصر کوچک است و n-k عنصر در طرف بیشتر تقسیم بندی موجود است.
اگر i=k باشد، x را برگردانید در غیر این صورت اگر i<k باشد از Select به صورت بازگشتی برای پیدا کردن iامین عنصر کوچک در طرف کم تر استفاده کرده یا اگر i>k باشد، از آن برای پیدا کردن (i-k)امین عنصر کوچک در طرف بیشتر استفاده کنید.

برای تحلیل زمان اجرای Select، ابتدا یک حد پایین روی تعداد عناصر بزرگتر از عنصر تقسیم کنندهٔ x تعیین می کنیم. حداقل نصفی از میانه‌های پیدا شده در مرحله 2 بزرگتر از x یعنی میانهٔ میانه‌ها هستند. بنابراین در حداقل نصف n/5گروه، 3 عنصر وجود دارند که از x بزرگترند، به جز برای گروهی که اگر5 به n قابل قسمت نباشد، کم تر از 5 عنصر دارد و گروهی که خود شامل x است. با منظور نکردن این دو گروه ثابت می‌شود که تعداد عناصر بزرگتر از x حداقل برابر است با

3(2-1/2n/5)

که این عبارت بزرگتر یا مساوی با 3n/10-6 است. به طور مشابه عناصری که کوچک تر از x هستند حداقل 3n/10-6 است. بنابراین در بدترین حالت، Select برای حداکثر 7n/10+6 عنصر در مرحلهٔ 5 به طور بازگشتی فراخوانی می‌شود.






آزمون فرض آماری

آزمون فرض آماری (به انگلیسی: Statistical hypothesis testing) در علم آمار روشی است برای بررسی ادعاها یا فرض‌ها دربارهٔ پارامترهای توزیع در جوامع آماری. در این روش فرض صفر (به انگلیسی: Null-hypothesis) یا فرض اولیه مورد بررسی ست که متناسب با موضوع مطالعه فرضی به عنوان فرض بدیل یا فرض مقابل (به انگلیسی: Alternative-hypothesis) انتخاب می‌شود تا درستی هر کدام نسبت به هم مورد آزمون قرار گیرد.






آمار پارامتری

آمار پارامتری به مجموعه روش‌های آماری‌ای گفته می‌شود که مدل‌ای پارامتری برای پدیدهٔ احتمالی مورد مطالعه فرض می‌شود و همهٔ استنتاج‌های آماری از آن پس بر اساس آن مدل انجام می‌شود.

به عنوان مثال فرض می‌شود که توزیع نمره‌های یک امتحان از توزیع نرمال پیروی می‌کند. در نتیجه برای مشخص‌شدن توزیع احتمال، کافی است میانگین و واریانس توزیع را از روی داده‌های تجربی (نمره‌های دانش‌آموزان) به دست بیاوریم. حال برای پاسخ‌گفتن به سوال‌هایی چون «درصد دانش‌آموزانی که نمره‌ای بین ۱۰ تا ۱۵ آورده‌اند» از تابع توزیع به دست آمده استفاده می‌کنیم (البته بدیهی است که روش‌های ساده‌تری نیز برای چنین کاری وجود دارد).

نقطهٔ ضعف این شیوهٔ تحلیل آماری این است که در صورتی که مدل فرض‌شده با واقعیت تطبیق نداشته باشد، نتیجه‌گیری‌ها صحیح نخواهد بود.






آماره

آماره در آمار به عددی گویند که یک توزیع نمونه‌برداری را خلاصه‌سازی یا توصیف می‌کند.

تابع U=g(X۱, X۲, …, Xn)‎ از نمونهٔ تصادفی X۱, X۲, …, Xn را که در آن پارامتر مجهولی وجود نداشته باشد یک آماره می‌گویند. در این تعریف U یک متغیر تصادفی است که توزیع آن ممکن است به پارامتر بستگی نداشته باشد؛ اما تنها آماره‌هایی برای برآورد کردن مفید هستند که توزیعشان به پارامتر مجهول بستگی داشته باشد و اطلاعاتی در مورد این پارامتر به ما بدهند.






آنتروپی آماری
انتروپی آماری یک کمیت ترمودینامیکی است که در شیمی‌فیزیک کاربردهای فراوان دارد.






استنباط آماری
چنانچه به جای مطالعه کل اعضای جامعه، بخشی از آن با استفاده از فنون نمونه‌گیری انتخاب شده، و مورد مطالعه قرار گیرد و بخواهیم نتایج حاصل از آن را به کل جامعه تعمیم دهیم از روش‌هایی استفاده می‌شود که موضوع آمار استنباطی (Inferential statistics) است. آن چه که مهم است این است که در گذر از آمار توصیفی به آمار استنباطی یا به عبارت دیگر از نمونه به جامعه بحث و نقش احتمال شروع می‌شود. در واقع احتمال، پل رابط بین آمار توصیفی و استنباطی به حساب می‌آید.





چولگی

در آمار و نظریه احتمالات چولگی نشان دهنده میزان عدم تقارن توزیع احتمالی است. اگر داده‌ها نسبت به میانگین متقارن باشند، چولگی برابر صفر خواهد بود.






تعریف

چولگی برابر با گشتاور سوم نرمال شده است. چولگی در حقیقت معیاری از وجود یا عدم تقارن تابع توزیع می باشد. برای یک توزیع کاملاً متقارن چولگی صفر و برای یک توزیع نامتقارن با کشیدگی به سمت مقادیر بالاتر چولگی مثبت و برای توزیع نامتقارن با کشیدگی به سمت مقادیر کوچکتر مقدار چولگی منفی است.






داده

به طور کلی، می‌توان همهٔ دانسته‌ها، آگاهی‌ها، داشته‌ها، آمارها، شناسه‌ها، پیشینه‌ها و پنداشته‌ها را داده یا دیتا (به انگلیسی: Data) نامید. انسان برای ثبت و درک مشترک هر واقعیت و پدیده از نشانه‌های ویژهٔ آن بهره گرفته‌است.

انسان برای نمایاندن داده‌ها نخست از نگاره و در ادامهٔ سیر تکاملی آن از حروف، شماره‌ها و نشانه‌ها کمک گرفت. برای بازنمودن داده‌ها از این موارد کمکی یا ترکیبی از آن‌ها استفاده می‌شود






در رایانه

به اعداد، حروف و علائم که جهت درک و فهم مشترک از انسان‌ها یا رایانه سرچشمه می‌گیرند داده می‌گویند. داده‌ها معمولاً از سوی انسان‌ها بصورت حروف، اعداد، علائم و در رایانه به صورت نمادهایی (همان رمزهای صفر و یک) قراردادی ارائه می‌شوند. اصطلاح داده یک عبارت نسبی است یعنی اگر موجب درک و فهم لازم و کامل دراین مرحله شده‌است به عنوان آگاهی یا اطلاعات از آن نام می‌برند و چنانچه موجب درک و فهم کامل نگردد به عنوان همان داده به شمار می‌آیند و چون هدف نهایی آگاهی و اطلاعات است باید از سوی دست‌اندرکاران (انسان یا رایانه) دستکاری یا پردازش شوند. منظور از دستکاری یا پردازش داده‌ها انجام عملیاتی از قبیل جمع، تفریق، ضرب، تقسیم، مقایسه وغیره‌است.

داده‌ها مجموعه‌ای از نمادها (برای انسان حروف، اعداد، علائم و برای رایانه رمزهای صفر و یک) هستند که حقایق را نشان می‌دهند و برای انسان از طریق رسانه‌های وی (بینایی، شنوایی، چشایی، بویایی، بساوایی) و برای رایانه از طریق لوازم ویژه (صفحه کلید موس و غیره) به دست می‌آیند.

داده‌ها امروزه فقط از سوی انسان یا رایانه پردازش می‌شوند یعنی کارهایی روی آن‌ها صورت می‌گیرد. در پردازش داده‌ها (داده‌پردازی) در رایانه ابتدا داده‌ها به رایانه وارد می‌شوند. این داده‌ها درابتدا ذخیره شده و روی آن‌ها عملیاتی (جمع، تفریق، ضرب، تقسیم و...) صورت می‌گیرد. پس از این که این عملیات (پردازش) صورت گرفت معمولاً داده‌ها به یک رایانه دیگر یا دوباره به انسان‌ها منتقل می‌شود. در اغلب گزارش‌ها و یادداشت‌های سازمانی، داده‌ها به چشم می‌خورند. برای نمونه، تاریخ و مقدار یک صورت‌حساب یا چک، جزئیات فهرست حقوق، تعداد وسایل نقلیه‌ای که از نقطهٔ خاصی در کنار جاده گذشته‌اند،... نمونه‌هایی از داده‌ها هستند.






انواع داده‌ها از نظر ساخت‌یافتگی

داده‌های ساخت‌یافته
داده‌های نیمه‌ساخت‌یافته







داده‌های زمانی
در بسیاری از کاربردهای مبتنی بر داده‌ها و اطلاعات ذخیره‌سازی و بازیافت حالا ت و وضعیت‌های سیستم در طی زمان اهمیت می‌یابد.





داده‌های مکانی
داده‌های مکانی (geospatial data ) به مجموعه‌ای از داده‌ها گفته می‌شود که بیان کننده موقعیت جغرافیایی یک عارضه(طبیعی یا مصنوعی) بر روی زمین باشند. داده‌های مکانی معمولاً به صورت موقعیت و یا روابط هندسی ذخیره شده و قابل نمایش در نقشه‌ها می‌باشند. داده‌ها مکانی بیشتر در سامانه‌های اطلاعات مکانی نگهداری شده، قابل دسترسی و پردازش می‌باشند.





پردازش رایانه‌ای داده‌ها

پردازش رایانه‌ای داده‌ها هر فرایندی است که از برنامه‌ای رایانه‌ای برای واردسازی داده‌ها، خلاصه‌بندی، تحلیل و در غیر اینصورت تبدیل‌داده به اطلاعات قابل استفاده استفاده می‌کند.

علوم و فناوری پردازش داده‌ها دارای وسعت، گوناگونی، و پیچیدگی فراوانی بوده، و این زمینه از دانش به شاخه‌ها و زیر شاخه‌های متعددی تقسیم می‌شود، که برخی از آن‌ها عبارت است از:






پردازش علائم

پردازش علائم (سیگنال‌ها) را باید یکی از شاخه‌های وسیع و پر کاربرد در پردازش داده‌ها به حساب آورد.
page1 - page2 - page3 - page4 - page5 - page7 - page8 - | 7:14 pm
کاربردهای امروزی

اینترنت انعطاف پذیری بیشتری را در مورد ساعتهای کاری و موقعیت جغرافیایی فراهم می‌سازد بویژه با گسترش اتصالهای پرسرعت و نرم‌افزارهای کاربردی وب. امروزه اینترنت تقریباً از همه جا و به طرق مختلفی قابل دسترسی است، بویژه از طریق دستگاههای متحرک اینترنتی (Mobile Internet Device)، تلفن همراه، جعبه‌های بازی دستی(Handheld Game Console) و مسیریابهای سلولی(Cellular Routers) که به کاربران اجازه می‌دهد که هرکجا شبکه‌های بی سیم وجود دارد به اینترنت متصل شوند.





با وجود محدودیت اندازه صفحه کوچک دستگاههای جیبی، خدمات اینترنت مانند وب و پست الکترونیک قابل استفاده‌اند. اینترنت همچنین بازار بزرگی برای شرکتها شده‌است. برخی از بزرگترین شرکتهای دنیا با بهره گیری از ماهیت کم هزینه تبلیغات و دادوستد اینترنتی (که به دادوستدالکترونیک(E-Commerce) مشهور است) بزرگ شده‌اند.این سریعترین راه برای انتشار همزمان اطلاعات بین افراد متعدد است. اینترنت متعاقباً راه و رسم خریدکردن را نیز متحول ساخته‌است. به عنوان مثال یک فرد می‌توانند کالایی مانند یک لوح فشرده(CD) را به صورت برخط(Online) سفارش داده و ظرف چند روز آن را از طریق پست دریافت کند و یا مستقیماً آن را در رایانه‌اش بارگیری(Download) نماید.اینترنت همچنین امکانات بزرگی برای بازاریابی شخصی (Personalized Marketing) به ارمغان می‌آورد و بیشتر از هر رسانه تبلیغاتی دیگری به یک شرکت امکان تبلیغ خصوصی محصول برای یک فرد و یا گروهی از افراد را می‌دهد.از نمونه‌های بازایابی شخصی می‌توان به اجتماعات برخطی چون Facebook، Orkut، ،Twitter، Friendster، Myspace و مشابه آنها اشاره کرد که هزاران کاربر به عضویت آنها در می‌آیند تا خود را تبلیغ کنند و به صورت برخط دوست بیابند. بسیاری از آنها نوجوانان و جوانان بین ۱۳ تا ۲۵ سال هستند.وقتی که آنها خود را تبلیغ می‌کنند، علایق و سرگرمی‌های خود را نیز تبلیغ می‌نمایند و شرکتهای بازاریابی برخط(Online Marketing) نیز از آن سود می‌جویند تا به اطلاعاتی در مورد اینکه هریک از این کاربران معمولاً جه کالاهایی را به صورت بر خط می‌خرند، دست یابند و محصولات شرکت خود را برای کاربران مورد نظرشان تبلیغ کنند.

به اشتراک گذاری آنی و کم هزینه ایده‌ها، دانش و مهارت‌ها، با کمک نرم‌افزارهای تشریک مساعی (Collaborative Software) کارهای مشارکتی را بسیار آسانتر نموده‌است. گروهها نه تنها می‌توانند به ارزانی ارتباط برقرار کنند و ایده‌ها را به اشتراک بگذارند، بلکه در وهله اول به دلیل دسترسی بسیار گسترده اینترنت تشکیل گروهها آسانتر می‌شود.مثالی از این موضوع، جنبش نرم‌افزار آزاد است که محصولاتی چون لینوکس، فایرفاکس موزیلا و اپن‌آفیس بوجود آورد. "گپ" اینترنتی چه به شکل اتاقهای گپ IRC و چه به شکل پیام رسانی فوری (Instant Messaging) به همکاران اجازه می‌دهد که به راحتی ضمن کارکردن پشت رایانه هایشان با یکدیگر در تماس باشند. پیام‌ها حتی راحت تر و سریعتر از سیستم پست الکترونیکی مبادله می‌شوند. این سیستم‌ها می‌توانند به گونه‌ای توسعه یابند که امکان مبادله فایل و یا تماس تصویری را نیز به کاربران ارائه دهند.(مانند Yahoo Messenger)

سیستمهای کنترل نسخه (Version Control) به گروه‌های همکاری کننده اجازه می‌دهد که بر روی اسناد اشتراکی کار کنند، بدون اینکه تصادفاً کار یکدیگر را رونویسی کنند و یا منتظر رسیدن اسناد به دستشان باشند تا بتوانند کار خود را بر روی اسناد انجام دهند. تیم‌های تجاری و پرژه‌ای می‌توانند تقویم‌ها را نیز در کنار اسناد و اطلاعات به اشتراک بگدارند. چنین هماهنگی‌هایی در طیف وسیعی از موضوعات مانند پژوهشهای علمی، تولید نرم‌افزار، برنامه ریزی کنفرانس وفعالیتهای سیاسی صورت می‌گیرد. همکاریهای سیاسی و اجتماعی با گسترش دسترسی به اینترنت و افزایش سوادرایانه‌ای افزایش می‌یابد. از رویدادهای فلش ماب در اوایل ۲۰۰۰ تا استفاده از شبکه‌های اجتماعی در اعتراضات به انتخابات ۲۰۰۹ در ایران. اینترنت به افراد این امکان را می‌دهد که به طرز بسیار موثر تری از هرروش دیگری با هم کار کنند.

اینترنت امکان دسترسی از راه دور به رایانه‌های دیگر و انباره‌های اطلاعات در هرجای دنیا که باشندرا به کاربران رایانه می‌دهد. آنها می‌توانند برای این کار، در صورت نیاز، از فناوریهای امنیتی، رمزنگاری و احراز هویت نیز استفاده کنند. مثلاً یک حسابدار که در منزل خود نشسته‌است می‌تواند حسابرسی دفاتر شرکتی را که در کشور دیگری قرار دارد، بر روی سروری که در کشور سومی قرار گرفته و توسط متخصصینی در کشور چهارم نگهداری می‌شود، انجام دهد ویا یک کارمند اداره می‌تواند در هر جای دنیا که باشدمی تواند یک نشست میزکاردور (Remote Desktop) رااز طریق اینترنت و یک شبکه خصوصی مجازی (VPN) ایمن به رایانه‌اش در اداره باز کند.




اطلاعات

بسیاری از افراد واژه‌های "اینترنت" و "وب جهان گستر"(یابه صورت کوتاه "وب") را به جای هم بکار می‌برند، حال آنکه این دو واژه معناهای متفاوتی دارند. وب جهان گستر مجموعه‌ای جهانی از اسناد و تصاویر و سایر منابعی است که به وسیله ابرپیوندها با یکدیگر ارتباط منطقی دارند و با استفاده از شناسه‌های منبع یکنواخت (به انگلیسی: Uniform Resource Identifier) ویا به اختصار URI مورد مراجعه قرار می‌گیرند. URIها به ارائه دهندگان اجازه می‌دهد که سرویسها و مشتریان را به صورت سمبولیک مشخص نمایند. تا مکان یابی و آدرس دهی وب سرورها، سرورهای پرونده و سایر پایگاه داده‌هایی که اسناد را ذخیره می‌کنند و همچنین عرضه دسترسی به منابع از طریق پروتکل HTTP، اصلی‌ترین پروتکل حامل وب، را ممکن سازند.HTTP تنها یک از صدها پروتکلی است که روی وب استفاده می‌شود. وب سرویسها نیز می‌توانند از این پروتکل برای ارتباط استفاده کنند.

مرورگرهای وب جهان گستر مثل اینترنت اکسپلورر مایکروسافت، فایرفاکس، اپرا، سافاری اپل، و گوگل کروم با استفاده از ابرپیوندهای تعبیه شده درون صفحات، به کاربران امکان می‌دهند از یک صفحه وب به صفحه دیگرگردش کنند. این اسناد ممکن است ترکیبی از داده‌های رایانه‌ای شامل گرافیک، صدا، متن ساده، ویدیو، چندرسانه‌ای و محتوای تعاملی شامل بازی، برنامه‌های اداری و نمایشهای علمی باشد. از راه پژوهشهای اینترنتی برپایه جستجوی کلیدواژهها با استفاده از موتورهای جستجوی وب مثل یاهو و گوگل کاربران می‌توانند به سرعت و سادگی به حجم گسترده و متنوع اطلاعات بر خط دسترسی داشته باشند. در مقایسه با دانشنامههای چاپی و کتابخانههای سنتی، وب جهان گستر امکان عدم تمرکز اطلاعات را فراهم ساخته‌است. وب همچنین به افراد و سازمانها توانایی انتشار ایده‌ها و افکارشان را برای شماربسیاری از مخاطبین بالقوه با هزینه وتاخیر زمانی کمینه می‌دهد. انتشار یک صفحه وب، وب نوشت، یا ساخت یک وبگاه هزینه اولیه بسیار پایینی دارد و سرویسهای رایگان نیز وجود دارند، هرچندکه انتشار و نگهداری وبگاه‌های بزرگ و حرفه‌ای بااطلاعات جذاب، متنوع و به روز هنوزمشکل و پرهزینه‌است. بسیاری از افراد، شرکتها و گروهها از وب نوشت هاکه به گستردگی برای یادداشت‌های روزانه به روزشدنی به کارمی روند نیز استفاده می‌کنند.برخی از سازمانهای تجاری کارکنان خود کارکنان خود را تشویق می‌کنند که در حوزه تخصص خود توصیه‌هایی را در وبگاه ارائه دهند، به این امید که با دانش تخصصی و اطلاعات رایگان، بازدیدکنندگان را تحت تاثیر قراردهند وبه شرکت خود جذب کنند. نمونه این روش در مایکروسافت دیده می‌شود که نرم‌افزارنویسان این شرکت، وب نوشت‌های شخصی خود را منتشر می‌کنند تا علاقه عمومی را نسبت به کارشان بینگیزند.

تبلیغ برخط در صفحات وب پربیننده می‌تواند سود زیادی در برداشته باشد. دادوستدالکترونیک یا فروش محصولات مستقیماً از طریق وب نیز به رشد خود ادامه می‌دهد. در روزهای نخست وب، وبگاه‌ها تنها مجموعه‌ای از پروندههای متنی اچ تی ام‌ال(HTML) کامل شده و منزوی بود که بر روی وب سرورها ذخیره می‌شدند. به تازگی وبگاه‌ها توسط نرم‌افزارهای مدیریت محتوا و ویکی و با محتوای اولیه اندک ساخته می‌شوند. مشارکت کنندگان سیستم پایگاه داده‌های اصلی را توسط صفحات ویرایشگری که به همین منظور ساخته شده‌اند با محتوای مورد نظر پر می‌کنند، حال آنکه بازدیدکنندگان تنها شکل نهایی HTML صفحات را می‌بینند. پروسه گرفتن محتوای جدید و دردسترس قرار دادن آن برای بازدیدکنندگان مورد نظر ممکن است شامل سیستم‌های سردبیری، تاییدی و امنیتی باشد.



ارتباط

پست الکترونیک یکی از سرویسهای ارتباطی مهم در دسترس بر روی اینترنت است. مفهوم فرستادن پیامهای متنی الکترونیکی که به گونه‌ای به نامه‌ها و یادداشتهای پستی می‌ماند، قدمتی بیش از اینترنت دارد. امروزه یکی از مسایلی که می‌تواند حائز اهمیت باشد درک تفاوت بین پست الکترونیک اینترنتی و سامانه‌های پست الکترونیکی داخلی است. یک نامه الکترونیکی اینترنتی ممکن است از شبکه‌های مختلفی عبورکند و بر روی ماشینهای مختلفی به صورت رمزنشده دخیره شود که از کنترل فرستنده و گیرنده نامه کاملاً خارج اند. دراین مدت کاملاً امکانپذیر است که این نامه توسط اشخاص ثالثی محتوای آن خوانده و یا حتی دستکاری شود. سامانه‌های پست الکترونیکی کاملاً داخلی که در آن نامه هاهرگزازمحدوده شبکه داخلی سازمان خارج نمی‌شوند بسیار ایمن تر هستند، هر چند که در هرسازمانی کارکنان فناوری اطلاعات و یا پرسنل دیگری هستند که شغلشان در ارتباط با نظارت و گاهی دسترسی به نامه‌های دیگران است. تصاویر و اسناد و سایر پرونده‌ها نیز می‌تواند به صورت پیوست نامه الکترونیک فرستاده شود. نامه‌های الکترونیکی را می‌توان به چندین نشانی پست الکترونیکی رونوشت نمود.

تلفن اینترنتی نیز سرویس ارتباطی دیگری است که با پیدایش اینترنت امکانپذیر شد. صدا روی پروتکل اینترنت(VoIP) نام پروتکلی است که زیر بنای همه ارتباطات تلفنی اینترنتی است. ایده آن در اوایل دهه ۱۹۹۰ همراه با برنامه‌های واکی-تاکی گونه برای رایانه‌های شخصی ظهور کرد. در سالهای اخیر سیستمهای VoIP سادگی استفاده و راحتی تلفن‌های معمولی را پیدا کرده‌اند. فایده این کار ان است که چون ترافیک صدارااینترنت حمل می‌کند، VoIP هزینه بسیار کمی دارد و حتی می‌تواند رایگان باشد. به ویژه برای آن دسته از اتصالات اینترنت که همیشه برقرارند (مانند مودم کابلی یا ADSL) گزینه مناسبی است. VoIP در حال پخته شدن و تبدیل شدن به رقیب جایگزینی برای سیستم‌های تلفن سنتی است. هم‌کنش‌پذیری بین عرضه کنندگان مختلف بهبود یافته و امکان برقراری و یا در یافت تماس با تلفن‌های معمولی نیز به وجود آمده‌است. کارتهای شبکه ساده و ارزان VoIP نیز در دسترس هستند که نیاز به وجود رایانه برای استفاده از VoIPرا ازبین می‌برند.

کیفیت صدا از یک تماس تا تماس دیگر تغییر می‌کند، اما غالباً کیفیت برابر یا بهتر از تلفن معمولی است. مشکلاتی که برای VoIP باقی می‌مانند، گرفتن شماره تلفن‌های اظطراری و قابلیت اطمینان است. در حال حاضر تعدادی از ازائه دهندگان VoIP سرویس شماره‌های اظطراری را ارائه می‌دهند اما هنوز به صورت جهانی در دسترس نیست. تلفن‌های سنتی انرژی را از خط تلفن می‌گیرند و در صورت قطع برق می‌توانند همچنان عمل کنند. برای VoIP این امکان بدون استفاده از منبع تغذیه پشتیبان برای تغذیه تجهیزات تلفن و دسترسی به اینترنت، وجود ندارد. VoIP همچنین محبوبیت روز افزونی بین علاقه‌مندان بازیهای کامپیوتری به عنوان شکلی از ارتباط بین بازیکنان می‌یابد.



انتقال داده

اشتراک فایل نمونه‌ای از انتقال مقادیر بزرگ داده از طریق اینترنت است. یک فایل رایانه‌ای را می‌توان به صورت پیوست نامه الکترونیکی به دوستان و همکاران فرستاد. می‌توان آن را دریک وبگاه ویا اف تی پی سرور( FTP Server) بارگذاری (Upload) نمودتا به آسانی توسط دیگران بارگیری(Download) شود. می‌توان آن را در یک "مکان مشترک" در یک کارسازپرونده(File Server) قرار دارد تا به سرعت و آسانی در اختیار همکاران قرار گیرد. بار سنگین بارگیریهای شمار زیاد کاربران را می‌توان با به کاربردن کارساز(سرور)های آینه و شبکه‌های تظیر-به-نظیر کاهش داد. دسترسی به فایل را می‌توان از طریق تصدیق هویت کاربر کنترل کرد. انتقال فایل بر روی اینترنت را نیز می‌توان با رمزگذاری در پوشش ابهام قرار داد. دستیابی به فایل ممکن است در گرو پرداخت مبلغی باشد که می‌تواند توسط کارت اعتباری پرداخت شود. مبدا و اعتبار فایل از طریق امضای دیجیتال و یا MD۵ و سایر روشهای هضم پیام قابل بررسی است. این ویژگیهای ساده اینترنت در مقیاس جهانی، به تدریج تولید، فروش و توزیع هر چیزی را که قابل ارائه به صورت فایل باشد را تغییر می‌دهد که این چیزها شامل همه انتشارات چاپی، محصولات نرم‌افزاری، اخبار، موسیقی، فیلم، ویدیو، عکاسی، گرافیک و آثار هنری دیگر می‌باشد.

رسانه جریانی(Streaming Media) همان عملی است که بسیاری از پخش کنندگان صدا و سیما، به واسطه آن، برنامه‌های خودرا از طریق اینترنت به صورت زنده پخش می‌کنند.(به عنوان مثال BBC) آنها امکان دیدن برنامه‌های غیر همزمان ضبط شده را نیز به کاربران می‌دهند. گروهی از آنها صرفاً برنامه‌های خود را از طریق اینترنت پخش می‌کنند. این بدین معنی است که یک رایانه می‌تواند به این رسانه‌های برخط، شبیه به همان صورتی که پیش از این تنها از طریق گیرنده‌های رادیو و تلویزیون امکانپذیر بود دست یابد. پادکستها گونه دیگری از پخش اینترنتی هستند که فایل صوتی توسط رایانه بارگیری می‌شود و سپس به یک پخش کننده رسانه قابل حمل منتقل می‌شود تا بتوان بعداً در حرکت بدان گوش داد.

وب بین (Webcam)ها را نیز می‌توان گونه کم هزینه تر رسانه جریانی دانست. اگرچه برخی از وب بین‌ها تصویر با ترخ فریم کامل می‌دهند اما غالباً تصویر کوچک است و به کندی به روز می‌شود. کاربران اینترنت می‌توانند حیواناتی را دریک جنگل افریقایا گزارش تصویری از ترافیک در یک میدان را به صورت زنده و بی درنگ تماشا کنند و یا بر روی دارایی‌های خود از راه دور نیز نظارت بصری داشته باشند.محبوبیت اتاقهای گپ ویدیویی ویا کنفرانس تصویری نیز با افزایش تعداد کاربرانی که وب بین دارند، افزایش می‌یابد. یوتیوب در تاریخ ۱۵ فوریه ۲۰۰۵ ایجاد شد و اکنون وبگاه پیشرو در زمینه ویدیوهای جریانی است. یوتیوب از یک پخش کننده وب برپایه فلش برای پخش ویدیو استفاده می‌کند. کاربران ثبت نام کرده می‌توانند مقدار نامحدودی ویدیو را در این وبگاه بارگذاری کنند و پروفایل شخصی بسازند. یوتیوب ادعا می‌کند که کاربرانش روزانه صدها میلیون ویدیو را بارگذاری و یا تماشا می‌کنند.



دسترسی
رایج‌ترین زبان برای ارتباطات در اینترنت زبان انگلیسی است. این ممکن است ناشی از زادگاه اینترنت و همچنین نقش زبان انگلیسی به عنوان زبان بین‌المللی باشد. ناتوانی رایانه‌های اولیه - که اغلب در امریکا ساخته می‌شدند - در پردازش نویسه (کاراکتر)های به جز گونه انگلیسی الفبای لاتین نیز ممکن است با این موضوع مرتبط باشد. پس از انگلیسی(۲۸٪ از بازدیدکنندگان وب)، پرخواهان ترین زبانها در وب جهان گستر عبارنتد از : چینی ۲۳٪، اسپانیایی ۸٪، ژاپنی ۵٪، پرتغالی و آلمانی (هر کدام ۴٪)، عربی و فرانسه و روسی (هرکدام ۳٪)و کره‌ای ۳٪.بر پایه منطقه، ۴۲٪ از کاربران اینترنت در آسیا، ۲۴٪ در اروپا،۱۴٪ در امریکای شمالی، ۱۰٪ در امریکای لاتین و کارائیب، ۵٪ در آفریقا، ۳٪ در خاورمیانه و ۱٪ در استرالیا/اقیانوسیه.


فناوریهای اینترنت در سالهای اخیر بویژه در زمینه استفاده از یونیکد، به حد کافی گسترش یافته‌اند و امکانات مناسبی برای ارتباط در بسیاری از زبانهای دنیا در دسترس می‌باشد، اما همچنان مسائلی مانند موجیباکه (نمایش نادرست برخی نویسه‌های یک زبان) باقی هستند.

روشهای معمول دسترسی به اینترنت در خانه‌ها شامل دسترسی با شماره‌گیری (dial-up)، خطوط زمینی پهن باند(از طریق کابل کواکسیال، فیبر نوری و یا سیم مسی)، وای-فای (Wi-Fi)، ماهواره و فناوری ۳G تلفن همراه می‌باشد. اماکن عمومی که می‌توان در آنها از اینترنت استفاده نمود شامل کتابخانه‌ها و کافی‌نتها که در آنها رایانه‌هایی با اتصال به اینترنت مهیاست.همچنین کیوسکهای اینترنت در بسیاری از اماکن عمومی مانند سالن فرودگاه و کافی شاپها موجودند که بعضی از آنها برای استفاده‌های کوتاه و سرپایی در نظرگرفته شده‌اند.واژه‌های گوناگونی برای نامیدن این ترمینالها به کار می‌رودف از جمله : کیوسک عمومی اینترنت و یا پایانه دسترسی عمومی.

این ترمینالها به گستردگی برای کاربردهایی چون رزرو بلیط، سپرده گذاری بانکی، پرداخت برخط مورد استفاده قرار می‌گیرد. وای-فای(Wi-Fi) دسترسی بی سیم به شبکه‌های رایانه‌ای و در نتیجه به اینترنت را فراهم می‌کند. نقاط داغ (Hotspots) به مکانهایی گفته می‌شود که دسترسی به اینترنت بی سیم در آن نقاط امکانپذیر است و کاربران می‌توانند با لپ تاپ و یا دستیار دیجیتال شخصی(PDA) خود به اینترنت متصل شوند. گاهی این سرویس‌های بیسیم برای عموم و یا حداقل برای مشتریان رایگان ارائه می‌شود. یک نقطه داغ محدوده مکانی مشخصی را شامل می‌شود مثل محوطه یک دانشگاه، پارک و یا حتی سراسر نقاط یک شهر. سرویسهای تجاری Wi-Fi که کل شهر را پوشش می‌دهند هم اکنون در شهرهای لندن، وین، تورنتو، سانفرانسیسکو، فیلادلفیا، شیکاگو و پیتسبورگ ارائه می‌شوند. در این شهرها مشترکین می‌توانند در هر نقطه‌ای از شهر به شبکه وای-فای متصل شوند
.علاوه بر وای-فای، آزمایشهایی نیز در زمینه شبکه‌های بی سیم متحرک اختصاصی مانن ریکوچت و سرویسهای داده‌ای پرسرعت بر روی تلفنهای همراه، و شبکه‌های بی سیم ثابت انجام شده‌است. تلفنهای همراه پیشرفته مثل تلفن‌های همراه هوشمند (Smartphone) همگی با قابلیت اتصال به اینترنت از طریق شبکه تلفن عرضه می‌شوند. مرورگرهای وب مثل اپرا معمولاً نسخه‌ای برای این دستگاههای جیبی پیشرفته دارند.



آثار اجتماعی

اینترنت به دلیل خصوصیاتی چون قابلیت استفاده و دسترسی گسترده آن، اشکال کاملاً جدیدی از تعاملات، فعالیتها، و سازماندهی‌های اجتماعی را پدید آورده‌است. وبگاه‌های شبکه‌های اجتماعی چون فیس‌بوک، توییتر و مای‌اسپیس روشهای جدیدی برای معاشرت و تعامل خلق کرده‌اند. کاربران این سایتها قادرند اطلاعات گوناگونی به صفحات خود بیفزایند، علایق مشترکی را دنبال کنند و به دیگران مرتبط شوند. وبگاه‌هایی مثل لینکداین به پرورش ارتباطات حرفه‌ای و تجاری می‌پردازد. یوتیوب و فلیکر هم در زمینه ویدیوها و تصاویر کاربران تخصص دارند.

دهه اول سده بیست و یکم، شاهد پرورش اولین نسلی است که در شرایطی رندگی می‌کنند که اینترنت به گستردگی در دسترس می‌باشد. این مسایل و نگرانی‌هایی را به دنبال دارد از جمله مسئله حفظ حریم خصوصی و هویت و توزیع غیر مجاز مواردی که تحت قانون کپی رایت محافظت می‌شوند. این بومیان دیجیتال با انبوهی از مسایلی مواجه می‌شوند که در مورد نسلهای قبلی وجود نداشت.

اینترنت کاربرد جدیدی به عنوان بک ابزار سیاسی یافته‌است مه این منجر به سانسوراینترنت می‌شود. نمونه استفاده سیاسی از اینترنت، مبارزه انتخاباتی هاوارد دین در سال ۲۰۰۴ در ایالات متحده بود که به دلیل جمع آوری کمکهای مردمی از طریق اینترنت شایان توجه بود. بسیاری از گروههای سیاسی از اینترنت برای سازماندهی در انجام ماموریت خود استفاده می‌کنند. برخی از دولتها مانند ایران، کره شمالی، میانمار، چین وعربستان، آنچه را که مردم می‌توانند از طرق اینترنت ببینند، به ویژه در مورد مسایل سیاسی و مذهبی محدود می‌نمایند.
این کار از طریق نرم‌افزارهایی که دامنه و محتوا را فیلتر می‌کنند صورت می‌پذیرد. در نروژ، دانمارک، فنلاند و سوئد، ارائه دهندگان اصلی خدمات اینترنت به صورت داوطلبانه و احتمالاً برای اجتناب از قانون شدن فیلترینگ، قبول کرده‌اند که دسترسی به سایتهایی که توسط مقامات مسوول لیست شده‌است را محدود نمایند. اگرچه قرار بر این است که این آدرسهای ممنوع شده تنها شامل وبگاههای هرزه نگاری کودکان باشد، اما محتوای این لیست مخفی است.

در بسیاری از کشورها مانند ایالات متحده امریکا، اگرپه قوانینی در ممنوعیت پخش موارد دربردارنده هرزه نگاری کودک تصویب نموده‌اند اما استفاده از نرم افرارهای فیلترینگ را اجباری نکرده‌اند. نرم‌افزارهای تجاری و یا رایگان بسیاری تحت عنوان نرم‌افزار کنترل محتوا در دسترس هستند که کاربران از طریق آنها می‌توانند وبگاههای مستهجن را در رایانه شخصی و یا شبکه محلی مسدود نمود تا از دسترسی کودکان به مواد هرزه نگاری و یا خشونت نگاری جلو گیری نمود.

اینترنت از آغاز پیدایش همواره وسیله مناسبی برای فعالیتهای تفریحی بوده‌است. بسیاری از انجمن‌های اینترنتی بخشهایی برای بازی و ویدیوهای خنده دار و کارتونهای کوتاه در قالب انیمیشن‌های فلش(Flash) دارند. بیش از ۶ میلیون نفر در اینترنت از وب نوشت‌ها و تخته‌های پیام برای برقراری ارتباط استفاده می‌کنند. صنایع هرزه نگاری و قمار از اینترنت سود می‌جویند تا وبگاههایی بسازند که منبع کلان تبلیغات برای سایر وبگاهها می‌باشند.
اگرچه بسیاری از دولتها برای محدود سازی استفاده این دو صنعت ازاینترنت تلاش کرده‌اند اما در جلوگیری از گسترش محبوبیت آنها چندان موفق نبوده‌اند.یکی از فعالیتهای تفریحی اصلی در اینترنت، بازیهای چند نفره است. این شکل تفریح اجتماعاتی را بوجود می‌آورد که در آن افراد از هر سن و نژادی از دنیای بازیهای چندنفره کامپیوتری لذت می‌برند. اگرچه بازیهای برخط از سال ۱۹۷۰ وجود داشته‌اند،

اما گونه مدرن این بازیها با خدمات اشتراکی مانند گیم‌اسپای و MPlayer آغاز شد. غیر مشترکین محدود به بازیهای خاص و یا زمان بازی خاص بودند. بسیاری از مردم از اینترنت برای دسترسی و بارگیری(download) موسیقی و فیلم و سایر آثار استفاده می‌کنند. این خدمات به هر دو صورت رایگان و پولی، با استفاده ازسرورهای مرکزی و یا فناوریهای نظیر-به-نظیر توزیع شده ارائه می‌شوند.برخی از این منابع توجه بیشتری نسبت به سایرین در زمینه حقوق مولفین اصلی نشان دادهاند.

بسیاری از مردم از اینترنت برای دسترسی به اخبار، پیش بینی آب وهوا، گزارشهای ورزشی و جستجوی مطالب در مورد علاقه‌مندیهای خود استفاده می‌کنند. آنها از گپ برخط، پیام رسان فوری و پست الکترونیک برای در تماس بودن با دوستان خود در سراسر دنیا و به شیوه‌ای شبیه به دوست مکاتبه‌ای که در قدیم رواج داشت، استفاده می‌کنند. اینترنت شاهد شمار رو به افزایش میزکارهای وب که در آن کاربران به فایلها و تنظیمات خود دسترسی پیدا می‌کنند، بوده‌است."کم کاری سایبری" (Cyberslacking) محل اتلاف جدی منابع سازمانهاست. کارمندان انگلیسی به طور میانگین ۵۷٪ از وقت خود را به وب گردی در حین کار می‌پردازند.
ساعت : 7:14 pm | نویسنده : admin | مطلب قبلی | مطلب بعدی
مای نیمباز | next page | next page