ঘন্টারেখা এবং গ্যালটন বোর্ড



১.
“………….আর তখনই ফুলটা ফুটল, আর সে দেখতে পেল ওটা এক সত্যিকারের টিউলিপ। আর সেই ফুলের ভেতর সবুজ রঙের আসনে বসে ছিল ফুটফুটে একটি মেয়ে। একেবারেই ছোট ছিল সে, হাতের বুড়ো আঙ্গুলের অর্ধেকেরই সমান হবে। সবাই মিলে তার নাম দিল তাই বুড়োআঙ্গুলী।……“

কথাগুলো হ্যান্স অ্যান্ডারসনের “থাম্বেলিনা” গল্পের। অপূর্ব সুন্দর এক রূপকথা, বুড়োআঙ্গুলের চেয়েও ছোট এক মেয়ের গল্প। রূপকথায় তো অনেক কিছুই হয়, বাস্তবে কিন্তু মানুষ এত ছোট হয় না। বর্তমানে পৃথিবীর সবচেয়ে খাটো পূর্ণবয়স্ক মানুষ হচ্ছেন নেপালের চন্দ্র বাহাদুর, তার উচ্চতা এক ফুট সাড়ে নয় ইঞ্চি মানে দুই ফুটের থেকে সামান্য কম। বুড়োআঙ্গুলীর কাছে সেই হিসাবে তিনি দানব!


তবে সত্যি বলতে কি, আমাদের মানুষের হিসেবে চন্দ্র বাহাদুরের উচ্চতা অবাক করে দেওয়ার মতোই। যে পিগমিরা খাটো জাতি হিসেবে পরিচিত, তাদের উচ্চতাও গড়ে পাঁচ ফুটের মত হবে। অস্বাভাবিক উচ্চতার কথা যদি বলতেই হয়, তাহলে চন্দ্র বাহাদুর কিংবা সুলতান কোসেনের নাম বলতেই হবে আমাদের। তুরষ্কের সুলতান কোসেন বর্তমানে পৃথিবীর সবচেয়ে লম্বা ব্যক্তি, তার উচ্চতা আট ফুট তিন ইঞ্চি।

আমাদের চারপাশে নানা উচ্চতার লোক দেখা যায়। কেউ বেঁটে, কেউ মাঝারি, কেউ বেশ লম্বা। কিন্তু লক্ষ করলে দেখা যাবে যে খুব বেশি লম্বা লোক যেমন নেই, খুব বেশি খাটো লোকও তেমন দেখা যায় না। অধিকাংশ মানুষের উচ্চতাই গড়পড়তা, কিংবা তার আশে পাশে ঘুরঘুর করে। আমরা যদি উচ্চতার সাথে পৃথিবীর মানুষের সংখ্যার তুলনা করে একটা গ্রাফ আঁকি তাহলে সেটা দেখতে অনেকটা এমন দাড়াবে: 



বক্ররেখাটা দেখতে ঘন্টার মতো তাই এর নাম হচ্ছে ঘন্টারেখা, কিংবা ইংরেজিতে Bell Curve। শুধু উচ্চতা নয়, আমাদের চারপাশে আরও অনেক কিছু আছে যার গ্রাফ আঁকলে এমন দেখতে একটা ঘন্টারেখাই পাওয়া যাবে।

যেমন ধরা যাক পরীক্ষার নাম্বার। কোনো পরীক্ষা হলে তাতে খুব বেশি নাম্বার পায় এমন ছাত্রের সংখ্যা যেমন কম, খুব বেশি নাম্বার পায় না এমন ছাত্রের সংখ্যাও কম। দেখা যাবে গড়ে মাঝারি মানের নাম্বারই পেয়েছে অধিকাংশ ছাত্র (অবশ্য এই ঘটনার প্রায়ই ব্যতিক্রম ঘটে ইদানিং)।

জন্মের আঠার মাসের মধ্যে খবরের কাগজ পড়া এবং আট বছরের মধ্যে আটটি ভাষা জানার মত কাজ করেছিলেন নিউ ইয়র্কের প্রডিজি উইলিয়াম জেমস সিডিস। এখন পর্যন্ত রেকর্ড করা আই.কিউ. এর মধ্যে তারটিই সম্ভবত সর্বোচ্চ, ১৯০-২০০ এর মতো হবে। আমাদের আই.কিউ. কিন্তু ঘন্টারেখা মেনে চলে। পৃথিবীর অধিকাংশ মানুষের আই.কিউ. ১০০ এর আশে পাশে ঘুরঘুর করে। খুঁজলে আরো অনেক কিছু পাওয়া যাবে এমন। তথ্য-উপাত্ত যখন ঘন্টারেখা বেয়ে উঠে আর নামে, তখন তাদের বলে নরমাল ডিস্ট্রিবিউশন (Normal Distribution), যার বাংলা করলে হয় স্বাভাবিক বন্টন। নরমাল ডিস্ট্রিবিউশনের আরেকটি নাম হচ্ছে গাউসিয়ান ডিস্ট্রিবিউশন।

ঘন্টারেখা দেখে বুঝাই যাচ্ছে এটা সিমেট্রিক্যাল, অর্থাৎ প্রতিসাম্য। মাঝ বরাবর আমরা যদি একে দু-টুকরো করে ফেলি তাহলে দু’ভাগ দেখতে একই রকম হবে। কিন্তু সব ঘন্টারেখা দেখতে কি একই রকম? মোটেই না। 


ঘন্টারেখা নানারকম হতে পারে। কিন্তু সেটা কিসের উপর নির্ভর করে? একটা ঘটনা চিন্তা করা যাক। কোনো বিল্ডিং এর দুটো আলাদা আলাদা রুমে ইউক্রেন আর রোমানিয়ার বিজ্ঞানীদের মিটিং চলছে। গড় আই.কিউ. হিসাব করে দেখা গেল ইউক্রেনের রুমের গড় রোমানিয়ার তুলনায় অনেক বেশি। তারমানে কি ইউক্রেনের জনগণ তুলনামূলকভাবে বেশি বুদ্ধিমান? কিন্তু এমন যদি হয় ওই রুমে মানুষ ছিল মাত্র পাঁচজন যাদের মধ্যে পাঁচজনই বিজ্ঞানী, আর রোমানিয়ানদের মাঝে ছিল অন্তত ত্রিশ জন যাদের মধ্যে দশজন বিজ্ঞানী কিন্তু অন্য বিশজন হয় সাংবাদিক নয়তো সরকারি কর্মকর্তা (এখানে চিন্তা করে নিয়েছি যে বিজ্ঞানীদের আই.কিউ. অন্যদের থেকে বেশি)?

ঘন্টারেখার আকার নির্ভর করে তাহলে দুটো বিষয়ের উপর। একটা হচ্ছে মানগুলোর গড়। আরেকটা হচ্ছে মানগুলো কতটুকু ছড়িয়ে আছে তা। মানগুলো কতটুকু ছড়িয়ে আছে সেটা কেমন করে বের করে? বেশ কয়েকরকম উপায় আছে, কিন্তু নরমাল ডিস্ট্রিবিউশনের ক্ষেত্রে ব্যবহার করা হয় স্ট্যান্ডার্ড ডেভিয়েশন (Standard Deviation) ।

স্ট্যান্ডার্ড ডেভিয়েশন হিসেব করা খুবই সহজ। প্রথমেই গড় থেকে প্রতিটা মানের পার্থক্য বের করে সেগুলো বর্গ করে যোগ করে ফেলতে হবে। তারপর যোগফলটাকে তথ্যের সংখ্যা দিয়ে ভাগ করতে হবে। তারপর ভাগফলটাকে বর্গমূল করতে হবে। যদি একে আমরা $\sigma $ দিয়ে প্রকাশ করি তাহলে স্ট্যান্ডার্ড ডেভিয়েশনকে লেখা যায় এভাবে:

\[\sigma =\sqrt{\frac{\sum{{{\left( x-\overline{x} \right)}^{2}}}}{n}}\]

তবে বিশেষ ক্ষেত্রে সূত্রটা পাল্টে এমন হয়ে যায়। কারণটা আপাতত গুরুত্বপূর্ণ নয় বলে সেই আলোচনা বাদ দেওয়া যাক।

\[\sigma =\sqrt{\frac{\sum{{{\left( x-\overline{x} \right)}^{2}}}}{n-1}}\]

ঘন্টারেখা আমরা গ্রাফে আঁকতে পারি, কিন্তু তার জন্য একটা সমীকরণ থাকা প্রয়োজন। সমীকরণটির জন্য আমাদের স্ট্যান্ডার্ড ডেভিয়েশন $\sigma $ এর প্রয়োজন। এবার গড়কে যদি $\mu $ ধরে নেই তাহলে নরমাল ডিস্ট্রিবিউশনকে দেখতে লাগবে এরকম:
 
\[p(x)=\frac{1}{\sigma \sqrt{2\pi }}{{e}^{-\frac{{{(x-\mu )}^{2}}}{{{(2\mu )}^{2}}}}}\]

২. 
ক্যালকুলাসের আবিষ্কারক কে – এটা নিয়ে প্রথম থেকেই দ্বন্দ লেগে আছে। আইজ্যাক নিউটন ফ্লাক্সিওন নামে ক্যালকুলাস আবিষ্কার করে সেটার কোনো প্রকার প্রচার-প্রচারণায় যান নি। তার কয়েক বছর পর লিবনিজ ক্যালকুলাস নতুন করে আবিষ্কার করেন। তখন শুরু হয় লম্বা এক ঝগড়া, কে আসল আবিষ্কারক। নিউটন ইংল্যান্ডের শ্রেষ্ঠ বিজ্ঞানী তখন, তার পক্ষে মানুষের অভাব নেই। লিবনিজের পক্ষেও ছিলেন অনেকে। বিখ্যাত বার্নুলিরা ছিলেন। জন বার্নুলি, জ্যাকব বার্নুলি। জ্যাকব বার্নুলির নাম থেকেই এসেছে “বার্নুলি ট্রায়াল”।


 
বার্নুলি ট্রায়াল খুবই সাধারণ কিছু ঘটনা নিয়ে করা একটা এক্সপেরিমেন্ট। কিন্তু সেই ঘটনাগুলো কেমন হয়? এমন একটা কিছু ঘটছে চিন্তা করতে হবে, যার মাত্র দুটোই ফলাফল হতে পারে। যেমন কয়েন টস করলে হেড উঠতে পারে কিংবা টেল উঠতে পারে। হাত থেকে মেঝেতে ডিম পড়ে গিয়ে ভাঙতে পারে, নাও ভাঙতে পারে (না ভাঙ্গার সম্ভাবনা অবশ্য খুবই কম)। এমন একই ঘটনা যদি একই পরিবেশে একই শর্তে বারবার ঘটানো হয়, তবে সেটা একটা বার্নুলি ট্রায়াল।

আমরা ছবির বলটার দিকে তাকাই। বলটা উপর থেকে ছোট বাক্সটার উপর ড্রপ খেয়ে হয় বা দিকে যাবে নয়তো ডান দিকে যাবে। সাধারণত দু’দিকে যাওয়ার সম্ভাবনা সমান ধরে নেওয়া হয়। কিন্তু কোনো না কোনো কারণে আসলে সমান কখনো হয় না। বলের আকৃতি পুরোপুরি গোল না হতে পারে, ঠিক মাঝখানে ড্রপ না খেয়ে একপাশে খেতে পারে। বাক্সটার সমস্যা থাকতে পারে। মনে করি ডানদিকে ড্রপ খেয়ে পড়ার সম্ভাবনা হচ্ছে p, বাঁ দিকের জন্য 1-p। আমরা n বার বার্নুলি ট্রায়াল করলাম। কতটুকু সম্ভাবনা কিংবা সম্ভাব্যতা আছে যে বলটি ড্রপ খেয়ে ডানদিকেই পড়বে? 

সম্ভাব্যতা খানা হিসাব করার জন্য আমাদের দরকার হবে একটু সামান্য কম্বিনেটরিক্স। আমরা জানি n সংখ্যক জিনিস থেকে k সংখ্যক জিনিস কোনো পুনরাবৃত্তি ছাড়াই বাছাই করা যায় $\left( \begin{align}

& n \\

& k \\

\end{align} \right)$ উপায়ে। যারা একেবারেই কম্বিনেটরিক্স জানেন না তাদের জন্য সংক্ষিপ্ত করে বলতে গেলে:

\[\left( \begin{align}

& n \\

& k \\

\end{align} \right)=\frac{n!}{k!(n-k)!}\]

যেখানে n! হচ্ছে এক থেকে n পর্যন্ত সংখ্যাগুলোর গুণফল। তাহলে n সংখ্যক ঘটনা থেকে (মানে n সংখ্যক বল ড্রপ থেকে) k সংখ্যক বল ড্রপ নেওয়া যাবে যথারীতি $\left( \begin{align}

& n \\

& k \\

\end{align} \right)$ উপায়ে। সেই বলটা ঠিক ঠিক k বার ডানদিকে ড্রপ খাওয়ার সম্ভাব্যতা হচ্ছে ${{p}^{k}}$ এবং বাকি (n-k) বার অবশ্যই বা দিকে ড্রপ খাওয়ার সম্ভাব্যতা ${{(1-p)}^{n-k}}$ । তাহলে মোট সম্ভাব্যতা দাড়ায়:

\[P(k|n)=\left( \begin{align}

& n \\

& k \\

\end{align} \right){{p}^{k}}{{(1-p)}^{n-k}}\]
কেমন অসাধারণ ব্যাপার! যারা জানেন তারা দেখেই বুঝতে পারছেন বার্নুলি ট্রায়ালের সম্ভাব্যতা বের করার সূত্র মিলে যাচ্ছে বাইনোমিয়াল থিওরেম কিংবা দ্বিপদী উপপাদ্যের সাথে। যা কিনা আবার জ্যাকব বার্নুলির শত্রু (কিংবা প্রতিদ্বন্দী) আইজ্যাক নিউটনের মস্তিষ্কপ্রসূত। যদি ডান কিংবা বা দিকে পড়ার সম্ভাব্যতা সমান হয় তাহলে p=0.5 হয় এবং সম্ভাব্যতা দাঁড়ায় এরকম:

\[P(k|n)=\left( \begin{align}

& n \\

& k \\

\end{align} \right){{0.5}^{n}}\]
যদি n=4 হয় তাহলে যথাক্রমে শূন্য, এক থেকে শুরু করে চারবারই বলটির ডানদিকে ড্রপ খেয়ে পড়ার সম্ভাব্যতাগুলো হচ্ছে 0.0625, 0.25, 0.375, 0.25, 0.0625। এই মানগুলো আমরা গ্রাফ পেপারে বসালে দেখতে হবে অনেকটা নিচের ছবিটার মতো।


এখানে সম্ভাব্যতাগুলো একটা নির্দিষ্ট নিয়ম মেনে বন্টিত হচ্ছে। বার্নুলি ট্রায়ালের সম্ভাব্যতা দেখতে শুধু বাইনোমিয়াল থিওরেমের মতোই নয়, এই বন্টনটিকেও বলা হয় বাইনোমিয়াল ডিস্ট্রিবিউশন। আমরা দেখতে পাচ্ছি চারবারের মধ্যে ঠিক ঠিক দুইবার ডানদিকে বলটি ড্রপ খাওয়ার সম্ভাব্যতা সবচেয়ে বেশি। মনে রাখতে হবে, দুই চারের অর্ধেক। ড্রপের সংখ্যা দুই থেকে যতই দূরে যায়, সম্ভাবনা ততই কমে যেতে থাকে।

৩.



বিন মেশিন কিংবা গ্যালটন বোর্ডটি তৈরি করেছিলেন স্যার ফ্রান্টিস গ্যালটন। বোস্টনের বিজ্ঞান জাদুঘরে যন্ত্রটির বেশ বড় একটি মডেল আছে। স্যার গ্যালটন তার বোর্ডটি বানিয়েছিলেন একটা বিষয় হাতে-কলমে দেখানোর জন্য। সেই বিষয়টিই আমরা এখন কাগজে-কলমে দেখবো।

গ্যালটন বোর্ডের কাজ খুবই সহজ। একটি বল নিয়ে বোর্ডটির উপর দিয়ে ছেড়ে দেওয়া হয়। সেটি নানা জায়গায় ধাক্কা খেয়ে নিচের খোপে গিয়ে পৌছে। এভাবে নিচে বল জমা হতে থাকে।

আমরা বার্নুলি ট্রায়াল থেকে দেখেছি একটা বল যতবার ড্রপ খায় তার মাঝে ঠিক অর্ধেকবার ডানপাশে আর বাকি অর্ধেকবার বামপাশে পড়ার সম্ভাব্যতা হয় সবচেয়ে বেশি। গ্যালটন বোর্ডের বলটিও যদি ধাক্কা খেয়ে যতবার ডানপাশে যায় তার ঠিক ততোবারই বামপাশে যায়, তাহলে গিয়ে একেবারে মাঝের খুপরিটিতে গিয়ে পৌছে। বাইনোমিয়াল ডিস্ট্রিবিউশন অনুসারে সবচেয়ে বেশি বল তাই থাকবে মাঝের খোপে, আর দু’পাশে আস্তে আস্তে বলের সংখ্যা কমতে থাকবে। নিচের খোপে জমা হওয়া বলগুলোর দিকে তাকালো এবার একটা মজার বিষয় দেখতে পাওয়া যায়। খোপের বলগুলোর ছবিটা যেন আমাদের সেই ঘন্টারেখার সাথে মিলে যায়!

বিষয়টা মোটেও কাকতালীয় নয়। যদি একশবার একটা কয়েন টস করে বার্নুলি ট্রায়ালে জিজ্ঞাসা করা হয় ষাট কিংবা তার বেশিবার হেড পড়ার সম্ভাবনা কত, তাহলে হিসাবটি একটু আধটু নয় অনেক বড় হয়ে যায়। তখন ক্যালকুলেটরও ছিল না।


ফ্রান্সের পরিসংখ্যানবিদ (এবং জুয়াড়িদের পরামর্শক) আব্রাহাম ডি ময়েভার এই চিন্তাই করছিলেন, কেমন করে বড় বড় বার্নুলি ট্রায়াল সমাধান করা যায়। তিনি দেখতে পেলেন যে যদি ট্রায়ালের সংখ্যা বাড়িয়ে দেওয়া হয় তাহলে বাইনোমিয়াল ডিস্ট্রিবিউশনের গ্রাফের মাথাগুলো খুব সুন্দর একটা বক্ররেখা তৈরী করে।

ডি ময়েভার চিন্তা করলেন যদি এই বক্ররেখাকে কোনোভাবে গাণিতিকভাবে প্রকাশ করা যায় তাহলে বড় বড় সম্ভাব্যতা বের করায় কোনো সমস্যাই রইবে না। সে কাজে তিনি সফল হয়েছিলেন। এই বক্ররেখাটিই আমাদের অতিপরিচিত ঘন্টারেখা। স্যার ফ্রান্সিস গ্যালটন তার গ্যালটন বোর্ডটি তৈরী করেছিলেন এটি দেখানোর জন্য যে বাইনোমিয়াল ডিস্ট্রিবিউশন নরমাল ডিস্ট্রিবিউশনের প্রায় সমান।

নরমাল ডিস্ট্রিবিউশন বিজ্ঞান এবং পরিসংখ্যানের জন্য অত্যন্ত গুরুত্বপূর্ণ, কারণ চারপাশে তাকালেই আমরা একে দেখতে পাই। যেমন ধরা যাক, জ্যোতির্বিজ্ঞান। আগে যন্ত্রপাতি থেকে শুরু করে মানুষের ভুলের জন্য গ্রহ-নক্ষত্রের হিসাব-নিকাষে দেখা যেত নানা রকম ভুল। গ্যালিলিও সেগুলো পরীক্ষা করে দেখতে পান ছোট ছোট ভুলগুলো বড় ভুলের থেকে বেশি ঘটছে। ঊনিশ শতকের দিকে সেগুলো থেকে গণিতবিদ আদ্রিয়ান এবং গাউস আলাদা-আলাদাভাবে হিসাব করে প্রমাণ করে দিলেন যে এই ভুলগুলো নরমাল ডিস্ট্রিবিউশন মেনে চলে।

পদার্থবিজ্ঞানেও ঘন্টারেখার অবদান কম নয়। যেমন ধরা যাক, কোনো পাত্রের একটা গ্যাস অণুর গতিশক্তি বের করতে যাওয়া মহা ঝক্কির কাজ। কিন্তু যখন সবগুলো অণু একসাথে বিবেচনা করা হয়, তখন তাদের সম্ভাব্য গতিশক্তির গ্রাফ নরমাল ডিস্ট্রিবিউশন মেনে চলে।

**গুগলে খোঁজ করলেই গ্যালটন মেশিনের সিমুলেশন পাওয়া যায়। আগ্রহীরা পরীক্ষা করে দেখতে পারেন সেখানে।

তথ্যসুত্র:

[১] onlinestatbook.com/2/probability/binomial.html
[২] onlinestatbook.com/2/normal_distribution/
[৩] mathworld.wolfram.com/BinomialDistribution.html
[৪] mathworld.wolfram.com/GaltonBoard.html
[৫] en.wikipedia.org/wiki/Bean_machine

মৃন্ময়

নিজের বিষয়ে কথা বলতে আমার অস্বস্তি লাগে। তাই আমি নিজের বিষয়ে কিছু বলব না।

0 comments: