উপাত্ত সংকোচন
উপাত্ত সংকোচন বা ডাটা কম্প্রেশন হলো সংকেত প্রক্রিয়াকরণ, উৎস কোডিং [১] বা বিট-হার হ্রাস করা যা আসল উপস্থাপনের চেয়ে কিছু বিট ব্যবহার করে এনকোডিং তথ্য অন্তর্ভুক্ত করে।[২] সংকোচন হতে পারে হ্রাসমূলক বা হ্রাসহীন সংকোচনের একটি। হ্রাসমূলক সংকোচনে অপ্রয়োজনীয় তথ্য চিহ্নিত করে বাদ দিয়ে কিট হ্রাস করা হয়। তথ্যের হ্রাসহীন সংকোচনে কোনো তথ্য হ্রাস পায় না। হ্রাসমূলক সংকোচনে অপ্রয়োজনীয় বা কম প্রয়োজনীয় তথ্য হ্রাসের মাধ্যমে বিট হ্রাস করে।[৩]
উপাত্ত ফাইলের আকার হ্রাসের প্রক্রিয়া প্রায়ই উপাত্ত সংকোচন হিসাবে উল্লেখ করা হয়। তথ্য রুপান্তরের ক্ষেত্রে, এটিকে সোর্স কোডিং বলা হয়। তথ্যের উৎসে এনকোডিং করা হয় সেটিকে সঞ্চিত বা রুপান্তরিত করার পূর্বে।[৪] ত্রুটি শনাক্তকরণ বা সংশোধন বা লাইন কোডিং এর ক্ষেত্রে সোর্স কোডিংকে চ্যানেল কোডিং এর সাথে মিলিয়ে ফেলা ঠিক না, সেটি শুধু তথ্যকে সংকেতে রুপান্তরের ক্ষেত্রে প্রযোজ্য।
সংকোচন কার্যকরী কারণ এটি রিসোর্স হ্রাস করে যা তথ্য সংরক্ষণ বা প্রেরণের জন্য প্রয়োজন। কম্পিউটেশনাল রিসোর্সগুলি সংকোচন প্রক্রিয়ায় হ্রাস করা হয় এবং সাধারণত, এ প্রক্রিয়ার বিপরীত (ডিম্প্রেসেশন)। উপাত্ত সংকোচন একটি স্পেস-টাইম জটিলতার ট্রেড-অফ এর বিষয়। উদাহরণস্বরুপ, ভিডিওটিকে যথেষ্ট তাড়াতাড়ি ডিকম্প্রেস করার জন্য একটি কম্প্রেশন পরিকল্পনায় ব্যায়বহুল হার্ডওয়্যার প্রয়োজন হতে পারে ভিডিও ডিকম্প্রেশন হওয়ার সময় দেখার জন্য, আর দেখার আগে ভিডিওকে সম্পূর্ণ ডিকম্প্রেশ করার অপশনটি হতে পারে অসুবিধাজনক বা এতে অতিরিক্ত স্টোরেজ প্রয়োজন। ডাটা কম্প্রেশনের নকশা পরিকল্পনা ট্রেড-অফগুলোর বিভিন্ন বিষয়সমূহের অন্তর্ভুক্ত, সংকোচনের মাত্রাসহ, গতিবিধি উপস্থাপিত হয় (হ্রাসমূলক ডাটা কম্প্রেসন ব্যবহারের সময়), আর ডাটা কম্প্রেশ বা ডিকম্প্রেশ বরতে গণনীয় রিসোর্স প্রয়োজন হয়।[৫][৬]
হ্রাসহীন
সম্পাদনাহ্রাসহীন উপাত্ত সংকোচন কোনো তথ্য না হারিয়ে উপাত্তকে পুণরায় উপস্থাপনের জন্য সাধারণত পরিসংখ্যানগত বিয়োজ্যকে কাজে লাগায়, সূতরাং প্রক্রিয়াটি প্রতিবর্তনযোগ্য। হ্রাসহীন উপাত্ত সংকোচন সম্ভব কারণ প্রকৃত-পৃথিবীর অধিকাংশ উপাত্তই পরিসংখ্যানগত বিয়োজ্য পদর্শণ করে। উদাহরণস্বরুপ, কোনো ছবিতে রঙের এমন অংশ থাকতে পারে যা বিভিন্ন পিক্সেল অনুযায়ী পরিবর্তন হয় না; "লাল পিক্সেল,..." এর পরিবর্তে উপাত্তটি হয়তো "২৭৯ লাল পিক্সেলস" হিসেবে এনকোড হবে। এটি রান-লেনথ এনকোডিংয়ের একটি মৌলিক উদাহরণ। বিয়োজ্য অপসারনের মাধ্যমে ফাইলের আকার কমানোর অনেক পদ্ধতি আছে।
লেমপেল-জিভ (এল জেড) পদ্ধতিগুলো হ্রাসহীন সংকোচন জন্য পৃথিবীর সবচেয়ে জনপ্রিয় অ্যালগোরিদমগুলোর অন্তর্ভুক্ত।[৭] নিঃসৃতকরণ হচ্ছে গতি ডিকম্প্রেশন, রেটিও সংকোচনের জন্য এল জেড অপটিমাইজড এর উপর একটি পরিবর্তন, কিন্ত এতে সংকোচন ধীরগতির হয়ে যেতে পারে। নিঃ সৃতকরন ব্যকহার করা হয় পিকেজিপ, জিজিপ এবং পিএনজিতে। লেমপেল-জিভ-ওয়েলচ জিআইএফ ছবিতে, প্রোগ্রাম যেমন, পিকেজিপে, হার্ডওয়্যার ডিভাইস যেমন, মডেমে ব্যবহৃত হয়।[৮] এল জেড সংকোচন একটি তালিকা-মূলীয় নকশা ব্যবহার করে যেখানে লিখিত বিষয় হচ্ছে পুনঃরাবৃত্তির জন্য বাতিল উপাত্তের সূত্র। বেশিরভাগ এল জেড সংকোচন ইনপুটের দিক দিয়ে পূর্বের উপাত্ত থেকে তালিকাটি প্রগতিশীলভাবে তৈরি হয়। তালিকা নিজেই প্রায় হুফমেন এনকোডেড হয়। বর্তমানে যে এল জেড-মূলীয় কোডিং ভালো কাজ করছে সেগুলো হচ্ছে ব্রোতি আর এল জেড এক্স। এল জেড এক্স মাইক্রোসফটের সিএবি ফরমেটে ব্যবহৃত হয়।[তথ্যসূত্র প্রয়োজন]
সর্বোত্তম আধুনিক সংকোচনগুলো সম্ভাব্য নকশাগুলো ব্যবহার করে যেমন,আংশিক সাদৃশ্যের পূর্বাভাস করা। বুরুজ হুইলার রুপান্তরকে গাণিতিক নকশার একটি পরোক্ষ রূপ হিসেবে দেখা যায়।[৯]
ব্যাকরণ-মূলীয় কোডগুলোর শ্রেণি জনপ্রিয়তা লাভ করছে কারণ সেগুলো পুনরাবৃত্তিমূলক ইনপুটকে ব্যাপকভাবে সংকোচিত করতে পারে, উদাহরণস্বরুপ, একই বা কাছাকাছি সম্পর্কিত প্রজাতির জীবতাত্ত্বিক উপাত্ত,একটি বড় সংস্করণ করা নথিপত্রের ভান্ডার, ইন্টারনেট সংরক্ষণাগার ইত্যাদি। ব্যাকরণ-মূলীয় কোডগুলোর মৌলিক কাজ হলো একটি প্রসঙ্গ নির্মাণ করা- মুক্ত ব্যাকরণ অপসারণের একটি একক সূত্র। অনুসরণ এবং মেরামত হচ্ছে সর্বসমক্ষে সহজলভ্য অ্যাপলিকেশনগুলোর জন্য ব্যবহারিক ব্যাকরণ সংকোচন অ্যালগরিদম।[তথ্যসূত্র প্রয়োজন]
সম্ভাব্য নকশার সরাসরি ব্যবহারের অধিকতর পরিশোধনের জন্য পরিসংখ্যানগত অনুমানগুলো একটি অ্যালগোরিদমে মিলিত হতে পারে, যাকে গণনা কোডিং বলে। গণনা কোডিং একটি আরও আধুনিক কোডিং কৌশল, যেটি ইনপুট উপাত্ত চিহ্নগুলোর একটি অনুবর্তীতা থেকে এনকোড হওয়া বিটগুলোর একটি সূত্র তৈরির জন্য একটি সসীম সীমানা যন্ত্রের একটি গাণিতিক হিসাব ব্যবহার করে। এটি উচ্চতর সংকোচন অন্যান্য কৌশলে আর্কাইভ করতে পারে যেমন, বহুল পরিচিত যেমন হুফম্যান অ্যালগোরিদম। এটি যেসব স্বতন্ত্র উপস্থাপনাগুলো পূর্ণ সংখ্যার বিট ব্যবহার করে সেগুলো থেকে একের পর এক স্বতন্ত্র ইনপুট চিহ্ন ম্যাপিং প্রয়োজনীয়তা এড়ানোর জন্য একটি অভ্যন্তরীন স্মৃতি অংশ ব্যবহার করে অার উপাত্ত চিহ্নগুলোর সূত্র এনকোডের পর এটি অভ্যন্তরীণ স্মৃতিকে মুছে দেয়। গণনীয় কোডিং বিশেষকরে ভালোভাবে অভিযোজিত উপাত্ত সংকোচনের কাজগুলোতে যেখানে অনেকগুলো পরিসংখ্যান এবং প্রসঙ্গ-নির্ভরশীল, তত সহজে ইনপুট উপাত্তের সম্ভাব্য বিন্যাসের একটি অভিযোজিত নকশার সাথে সংযুক্ত হতে পারে। গণনীয় কোডিং এর একটি উদাহরণ ছিল এটিকে বিকল্প হিসেবে ব্যবহার করা (কিন্তু ব্যাপকভাবে ব্যবহার হতো না) জেপিইজি ছবির কোডিং মানের একটি বৈশিষ্ট্য।[১০] এটি তখন থেকে ভিডিও কোডিং এর অন্যান্য অনেক নকশায় ব্যবহার করা হচ্ছে, যেগুলোর মধ্যে রয়েছে এইচ.২৬৩, এইচ ২৬৪/এমপিইজি-৪, এভিসি এবং এইচইভিসি।[১১]
হ্রাসমূলক
সম্পাদনাহ্রাসমূলক উপাত্ত সংকোচন হ্রাসহীন উপাত্ত সংকোচনের বিপরীত। ১৯৮০ সালের পরে, ডিজিটাল ছবিগুলো সার্বজনীন হয়ে গেলো এবং উদিতভাবে তাদের সংকোচনের জন্য মানসম্পন্ন। ১৯৯০ সালের শুরুতে, হ্রাসমূলক সংকোচন বিশ্বব্যাপী ব্যবহৃত হতে শুরু করল।[৮] এই পরিকল্পনাগুলোতে কিছু তথ্য হারানো গ্রহণযোগ্য। উপাত্তের উৎস থেকে অপ্রয়োজনীয় বিবৃতি ফেলে দিয়ে সংরক্ষণের জায়গা বাঁচাতে পারে। হ্রাসমূলক সংকোচন পরিকল্পনাগুলো মানুষ কিভাবে উপাত্তকে উপলদ্ধি করে প্রশ্নের উপর গবেষণা করে নকশা করা হয়েছে। উদাহরণস্বরুপ, মানুষের চোখ ঔজ্বল্যে রং বৈচিত্রের চেয়ে বেশি সূক্ষ্ম সংবেদনশীল। অপ্রয়োজনীয় বিটগুলোর উপাত্ত চক্রাকারে ঘোরা বন্ধ করার মাধ্যমে জেপিইজি ছবি সংকোচন অংশ হয়ে কাজ করে।[৮] সেখানে উপাত্তকে উপলদ্ধি ও হ্রাসের মধ্যে একটি অনুরূপ ট্রেড অফ থাকে। কিছু জনপ্রিয় সংকোচন প্রত্যক্ষ পার্থক্যগুলো কাজে লাগায়, মিউজিক ফাইল, ছবি, ভিডিও ব্যবহারের অন্তর্ভুক্ত।
হ্রাসমূলক ছবির সংকোচন ছবির মানের সূক্ষ ক্ষয়ের সাথে সংরক্ষণ ক্ষমতা বৃদ্ধির জন্য ডিজিটাল ক্যামেরায় ব্যবহার হয়। একইভাবে, ডিভিডিগুলো হ্রাসমূলক এমপিইজি-২ ভিডিও কোডিং ফরমেট ব্যবহার করে ভিডিও সংকোচন জন্য।
হ্রাসমূলক অডিও সংকোচনে শ্রবণযোগ্য নয় এবং কম শ্রবণযোগ্য অংশ হ্রাস করতে সাইকোকাস্টিকের পদ্ধতিগুলো ব্যবহৃত হয়। মানুষের কথার সংকোচন আরো বিশেষায়িত কৌশলে সম্পাদিত হতে পারে; বক্তৃতা কোডিং বা কথা কোডিং কখনো কখনো অডিও সংকোচনের নীতি থেকে ভিন্ন নীতি বিশিষ্ট হয়ে যায়। বিভিন্ন অডিও আর বক্তৃতা সংকোচনের মান অডিও ফরমেট সংকোচন হিসেবে তালিকাভূক্ত হয়। বক্তৃৃতা সংকোচন ইন্টারনেট টেলিফোনিতে ব্যবহৃত হয়, উদহরণস্বরুপ, অডিও সংকোচন সিডি রিপ করতে ব্যবহৃত হয় এবং অডিও প্লেয়ার দ্বারা সংকেতমুক্ত বা ডেকোডেড হয়ে যায়।[৯]
তত্ত্ব
সম্পাদনাহ্রাসহীন সংকোচনের তত্ত্বীয় পটভূমি এসেছে তথ্য তত্ত থেকে (যা অ্যালগোরিদমিক তথ্য তত্তের সাথে কাছাকাছি সম্পর্কযুক্ত) আর নড়ন-হার তত্ত থেকে এসেছে হ্রাসমূলক সংকোচন। এই সম্পর্কে পড়া বাধ্যতামূলক করেছেন ক্লাউড সেনন, যিনি ১৯৪০ এর শেষের দিকে এবং ১৯৫০ এর শুরুতে এই প্রাথমিক কাগজ প্রকাশ করেছিলেন। সংকেতযুক্তকরণ বা কোডিং তত্তও এটির সাথে সম্পর্কিত। উপাত্ত সংকোচনের ধারণাও গাণিতিক অনুমানের সাথে গভীরভাবে সম্পর্কযুক্ত।[১২]
যন্ত্র শিক্ষা
সম্পাদনাযন্ত্র শিক্ষা এবং সংকোচন কাছাকাছি সম্পর্কিত: একটি পদ্ধতি যা একটি দেওয়া অনুক্রম এর ক্রমান্বয়ে সম্ভাবনা ধারণা করে, ঐচ্ছিক সংকোচনের জন্য ধারনার জন্য যখন অনুকূল সংকোচন ব্যবহৃত হতে পারে(আগের ইতিহাসের দেওয়া সর্বোত্তম সংকোচক খোজার মাধ্যমে) তখন এটির পুরো ইতিহাস ব্যবহৃত হতে পারে (আউটপুট বিন্যাসের উপর হিসেবেয় কোডিং এর মাধ্যমে)। সাধারণ তথ্যের জন্য উপাত্ত সংকোচন উচ্চতাচিহ্ন হিসেবে ব্যবহারের জন্য এই সমানতা ব্যবহৃত হয় একটি ত্তজর হিসেবে ব্যবহৃত হয়।[১৩][১৪][১৫]
ফিচার স্পেস ভেক্টর
সম্পাদনাযাহোক একটি নতুন বিকল্প দৃষ্টি পরোক্ষ ফিচার স্পেস ভেক্টরগুলোর ভেতর মানচিত্র বা ম্যাপ সূত্র দেখাতে পারে এবং এই ফিচার স্পেস এর মধ্যে সংকোচন মূলীয় সদৃশ্যতা গণনীয় সদৃশ্যতা পরিমান করে। উভয় সংকোচক সি এর জন্য। আমরা একটি ভেক্টর স্পেস নির্ধারণ করে এক্স, যেমন ঐ সি। মানচিত্রগুলো একটি সূত্র এক্স ইনপুট করে, ভেক্টর আদর্শের ||~এক্স|| অনুরূপ। ফিচার স্পেসগুলোর একটি ক্লান্তিকর পরিক্ষা সংরক্ষণের জায়গা দ্বারা প্রতিরোধিত সকল সংকোচন অ্যালগোরিদমের নিম্নাবস্থিত হয়। ফিচার ভেক্টরগুলো তিনটি হ্রাসহীন সংকোচন পদ্ধতিকে পরিক্ষা করা বন্ধ করে দেয়, এলজেডডারলিউ, এলজেড৭৭, পিপিএম।[১৬]
উপাত্ত পাথর্ক্যকরণ
সম্পাদনাউপাত্ত সংকোচনকে উপাত্ত পার্থক্যকরণের বিশেষ ক্ষেত্র হিসেবে দেখা হয়।[১৭][১৮] উপাত্ত পাথর্ক্যকরণ একটি উৎস ও লক্ষের দেওয়া পার্থক্য তৈরির মাধ্যমে গঠিত হয়, একটি দেওয়া উৎস এবং পার্থক্যকে জোড়া দিয়ে একটি লক্ষ তৈরি করার সাথে, যখন উপাত্ত সংকোচন একটি লক্ষ দেওয়া সংকোচিত ফাইলের লক্ষটি তৈরি করে, এবং ডিকম্প্রেশন গঠিত হয় একটি সংকোচিত ফাইলের দেওয়া লক্ষ তৈরি করে। যদিও কেউ খালি উৎস উপাত্ত নিয়ে উপাত্ত সংকোচনকে উপাত্ত পার্থক্যকরণ মনে করতে পারে। সংকোচিত ফাইলটি একটি "শূন্য থেকে পার্থক্যের অনুরূপ।" এটি নিশ্চিত এনট্রপি মনে করার অনুরূপ। (উপাত্ত সংকোচনের অনুরূপ) সম্পর্কিত এন্ট্রপির বিশেষ নজির হিসেবে (উপাত্ত পার্থক্যকরণের অনুরূপ) কোনো প্রাথমিক উপাত্ত ছাড়া।
যখন কেউ সংযোগে গুরুত্ব দেওয়ার ইচ্ছা করে, সংকোচন ব্যবধান শর্ত ব্যবহার করতে পারে, যা উপাত্ত পার্থক্যকরণকে নির্দেশ করে।
ব্যবহার
সম্পাদনাঅডিও
সম্পাদনাঅডিও উপাত্ত সংকোচনকে প্রগতিশীল পরিসীমা সংকোচনের সাথে মিলিয়ে ফেলা ঠিক না, অডিও উপাত্তের সংক্রমণ ব্যান্ডউইথ এবং সংরক্ষণের জায়গার প্রয়োজনীয়তা হ্রাসের সম্ভাবনা থাকে। অডিও সংকোচন অ্যালগোরিদমগুলো সফটওয়্যার -এ অডিও কোডেক সম্পাদিত হয়। হ্রাসমূলক অডিও সংকোচন অ্যালগোরিদমগুলো নির্ভরতা মূল্যে উচ্চতর সংকোচন প্রদান করে এবং সমৃদ্ধ অডিও অ্যাপলিকেশনে ব্যবহৃত হয়। এই অ্যালগোর্মিগুলো কম শ্রবণযোগ্য আওয়াজের নির্ভরতা কাটানোর বা কমানোর জন্য সাইকোকাস্টিকের উপর সম্পূণভাবে নির্ভর করে, যার ফলে প্রেরণ করার জন্য সংরক্ষণ করতে সংরক্ষণের জায়গা প্রয়োজনীয়তা হ্রাস করে।[২]
উভয়ই হ্রাসমূলক ও হ্রাসহীন সংকোচনে তথ্যের প্রাচুর্য হ্রাস করা হয়, সংকোচন-মুক্ত করা উপাত্তকে পুনঃউপস্থাপনের জন্য ব্যবহৃত তথ্যের পরিমান হ্রাসের জন্য পদ্ধতিগুলো কোডিং, প্যাটার্ন, সীকৃতি এবং রৈখিক অনুমান হিসেবে ব্যবহার করে।
অডিও মান, প্রেরণ, সংরক্ষণের জায়গা হ্রাসের মধ্যে গ্রহণযোগ্য ট্রেড-অফ নির্ভর করে অ্যাপলিকেসনের উপর। উদাহরণস্বরূপ, ৬৪০ এমবি কম্পেক্ট ডিস্ক (সিডি) ১ ঘণ্টার সংকোচন-মুক্ত উচ্চ নির্ভরশীল শব্দ বা মিউজিক ধরে রাখে, ২ ঘণ্টার কম মিউজিক হ্রাসহীনভাবে সংকোচন হয়,৭ ঘণ্টার মিউজিক এমপিথ্রি ফরমেটে মধ্যম বিট-হারে সংকোচিত হয়। একটি ডিজিটাল সাউন্ড রেকর্ডার সাধারণত ৬৪০ এমবির মধ্যে ২০০ ঘণ্টার স্পষ্ট বোধগম্য বক্তৃতা সংরক্ষণ করতে পারে।[১৯]
হ্রাসহীন অডিও সংকোচন একটি ডিজিটাল উপাত্তের উপস্থাপনা তৈরি করে যা, অাসল অডিও প্রবাহের সম্পূর্ণ আসলের মতো নকল থেকে সংকোচন-মুক্ত। হ্রাসমূলক সংকোচন কৌশল যেমন, ভার্বিস এবং এমপি৩ এর প্লেবেক এর মতো না। সংকোচন অনুপাত আসল আকারের ৫০-৬০% হয়[২০], যা ঐসব জাতিবাচক হ্রাসহীন উপাত্ত সংকোচনের সাথে সাদৃশ্যপূর্ণ। তরঙ্গাকৃতির জটিলতা ও আওয়াজের অবস্থানের দ্রুত পরিবর্তনের কারণে হ্রাসহীন উপাত্ত সংকোচন উচ্চ সংকোচন অনুপাত অর্জন করতে অক্ষম। কোডেক যেমন, এফএলএসি, সোর্টেন এবং টিটিএ সিগন্যালের স্পেকট্রাম হিসাব করতে রৈখিক অনুমান ব্যবহার করে। এই অ্যালগোরিদমগুলোর মধ্যে অনেকগুলো এই ছাঁকনি [-১ ১] ব্যবহার করে স্টেকট্রামকে সামান্য হেয়োইটেন বা ফ্লাটেন করতে। যার ফলে ঐতিহ্যবাহী হ্রাসহীন সংকোচন আরো দক্ষভাবে কাজ করতে অনুমোদিত হয়। এই প্রক্রিয়াটিকে সংকোচন-মুক্তের বিপরীত করা হয়।
যখন অডিও ফাইলগুলো প্রক্রিয়াকরণ করা হয়, সবগুলোকে আরো অধিকতর সংকোচনের মাধ্যমে বা সম্পাদনার জন্য, এটি অপরিবর্তিত আসল ফাইলের (সংকোচন-মুক্ত বা হ্রাসহীনভাবে সংকোচিত) থেকে কাজের জন্য কাম্য। কিছু উদ্দেশ্যের জন্য একটি হ্রাসমূলকভাবে সংকোচিত ফাইলের প্রক্রিয়াকরণ একটি সংকোচন-মুক্ত ফাইল হতে একই সংকোচিত ফাইল সৃষ্টি করতে সাধারণত একটি সর্বশেষ ফলাফল তৈরি করে। অতিরিক্তভাবে শব্দ সংযোজন বা মিশ্রণে হ্রাসহীন অডিও সংকোচন সংরক্ষণাগারের জায়গা বা মাস্টার কপিজ হিসেবে ব্যবহৃত হয়।
কিছু সংখ্যক হ্রাসহীন অডিও সংকোচন বিন্যাস বিদ্যামান থাকে। সোর্টেন একটি আগেকার হ্রাসহীন বিন্যাস। নতুনগুলো মুক্ত হ্রাসহীন অডিও কোডেক (এফএলএসি), অ্যাপেলের অ্যাপেল হ্রাসহীন (এএলএসি), এমপিইজি-৪ এএলএস, মাইক্রোসোফটের মিডিয়া অডিও ৯ হ্রাসহীন, মানকির অডিও, টিটিএ এবং ওয়েভপ্যাক অন্তর্ভুক্ত করে। তালিকাভূক্তকরণ সম্পন্ন করতে হ্রাসহীন কোডেক এর তালিকা দেখুন।
কিছু অডিও বিন্যাস হ্রাসমূলক ফরমেটের একটি সমন্বয় এবং হ্রাসহীন সংশোধনকে বৈশিষ্ট্য প্রদান করে; এটি সংশোধনকে খুলে যেতে অনুমোদন প্রদান করে করে যাতে সহজেই হ্রাসমূলক ফাইল পাওয়া যায়। যেমন, বিন্যাসগুলো এমপিইজি-৪ এএলএস (হ্রাসহীনের কাছে পরিমাপযোগ্য), ওয়েভপ্যাক এবং অপটিম ফ্রগ ডুয়েলস্ট্রিম অন্তর্ভুক্ত করে।
অন্য বিন্যাসগুলো স্বতন্ত্র পদ্ধতি (ইংরেজি: Distinct System) এর সাথে সংযুক্ত। যেমন:
- সরাসরি প্রবাহ পরিবর্তন, সুপার অডিও সিডিতে ব্যবহৃত হয়।
- ম্যারিডিয়ান হ্রাসহীন প্যাকিং, ডিভিডি-অডিও, ডোলডি ট্রু এইচডি, ব্লু-রে এবং এইচডি ডিভিডিতে ব্যবহৃত হয়।
হ্রাসমূলক অডিও কম্প্রেশন
সম্পাদনাহ্রাসমূলক অডিও সংকোচন বিশাল পরিসরের অ্যাপলিকেশনে ব্যবহৃত হয়। অতিরিক্তভাবে সরাসরি অ্যাপ্লিকেশগুলোতে (এমপি৩ প্লেয়ার ও কম্পিউটার), ডিজিটালি সংকোচিত অডিও প্রবাহ অধিকাংশ ভিডিও ডিভিডি, ডিজিটাল টেলিভিশন, ইন্টারনেটের দর্শনের মাধ্যম, স্যাটেলাইট এবং ক্যাবল রেডিওতে ব্যবহৃত হয়,অার স্থলজ রেডিও সম্প্রচারে বেড়েই চলেছে। হ্রাসমূলক সংকোচন হ্রাসহীন সংকোচনের চেয়ে অনেক বড় সংকোচন অর্জন করে (৫-২০ শতাংশ আসল প্রবাহের উপাত্ত না বরং ৫০-৬০ শতাংশ) কম জটিল উপাত্ত খারিজ করে।[২১]
অডিও সংকোচনের নতুনত্ব ছিল সাইকোকাইনাস্টিক ব্যবহার করা যাতে বোঝা যায় যে, অডিও প্রবাহের সব উপাত্ত মানুষের শ্রবণ পদ্ধতি দ্বারা অনুভূত করা যায় না। , অধিকাংশ হ্রাসমূলক সংকোচন প্রথমে প্রত্যক্ষজ অপ্রাসঙ্গিক আওয়াজ যা, শোনা কঠিন বুঝে নিয়ে প্রত্যক্ষজ বিয়োজ্য হ্রাস করে। সাধারণ উদাহরণ যেমন, উচ্চতর ফ্রিকোয়েন্সি ও আওয়াজ যেগুলো সংঘটিত হয় উচ্চতর আওয়াজের সময়। যে আওয়াজগুলোর কম বা সম্পন্ন সঠিকতা নেই সেগুলেরে সাথে কোডেড হয়।
যখন কোনো ফাইল সংকোচন-মুক্ত বা পুনরায় সংকোচিত (ডিজিটাল প্রজন্ম হ্রাস) হয় তখন হ্রাসমূলক অ্যালগোরিদমের কারণে অডিও -এর মানকে ভোগতে হয়। এটি হ্রাসমূলক সংকোচনকে পেশাদার অডিও অ্যাপলিকেশনগুলোতে অন্তবর্তী ফলাফল জমা করতে অনুপযুক্ত করে। যেমন, সাউন্ড এডিটিং এবং মাল্টিট্রাক রেকর্ডিং। যাহোক, এরা শেষ ব্যবহারকারীদের কাছে অনেক জনপ্রিয় (বিশেষত এমপিথ্রি) যা, এক মিনিট মূল্যের মিউজিক যথেষ্ট মানে সংরক্ষণ করতে পারে।
অডিও সংকেতের কোন তথ্য প্রত্যক্ষজ প্রাসঙ্গিক সে সিদ্ধান্ত নিতে, বেশিরভাগ হ্রাসমূলক সংকোচন অ্যালগোরিদম রুপান্তর ব্যবহার করে যেমন, পরিবর্তিত পৃথক কোসাইন্ রুপান্তর (এমডিসিটি) থেকে সময় ডোমেইন নমুনা তরঙ্গাকৃতি।
কোডিং পদ্ধতিসমূহ
সম্পাদনাবেশিরভাগ সংকোচন অ্যালগোরিদম সময় ডোমেন নমুনাকৃত তরঙ্গাকৃতিগুলোকে রুপান্তর ডোমেনে পরিবর্তন করতে রুপান্তর (এমডিসিটি) যেমন, পরিবর্তিত বিযুক্ত কোসাইন রুপান্তর ব্যবহার করার মাধ্যমে কোন তথ্যটি একটি অপ্রাসঙ্গিক অডিও সংকেত সেই সিদ্ধান্ত গ্রহণ করে। একবার রুপান্তরিত হয়ে গেলে, সাধারণত ফিকোয়েন্সি ডোমেনে, অনুরূপ ফ্রিকোয়েন্সিগুলো শ্রবণযোগ্যতা অনুযায়ী বিটগুলোর স্থান নির্ণয় করতে পারে। স্পেক্টামের উপাদানগুলের শ্রবণযোগ্যতা পরিমাপ করতে শোনার একদম প্রবেশস্থল, এককালীন মাস্কিং করা হয় এই নীতিমালা ব্যবহার করা হয়- বিস্ময় যাতে অন্য পৃথক সংকেত দ্বারা একটি সংকেতকে মাস্ক করা হয় এবং কিছু ক্ষেত্রে, সময়গত মাস্কিং- যেখানে একটি সংকেতকে অন্য একটি সময় দ্বারা পৃথককৃত সংকেত দ্বারা মাস্ক করা হয়। সমান শব্দমাত্রা সমোন্নিত রেখাগুলোও ব্যবহার করা হতে পারে উপাদানের প্রত্যক্ষজ গুরুত্ব পরিমাপ করতে। মানুষের কান-মস্তিষ্কের মিশ্রণের নকশা একত্রিত হয়, এমন প্রভাবগুলোকে প্রায়ই সাইকোকাষ্টিক নকশা বলা হয়।[২২]
অন্যান্য হ্রাসমূলক সংকোচক যেমন, রৈখিক অানুমানিক কোডিং, যা বক্তৃতায় ব্যবহৃত হয় তা উৎস মূলীয় সংকেত পদ্ধতির রচয়িতা। এই সংকোচকগুলো অডিও সংকেতকে স্পষ্ট করতে আওয়াজ জেনারেটর নকশা এলএফসির সাথে মানব কন্ঠ বিস্তার) ব্যবহার করে (যেটির স্পেকট্রাম চেপটানো) কোনটাইজেসনের আগে। এলপিসিকে সাধারণ কোডিং কৌশল হিসেবে চিন্তা করা যেতে পারে: অডিও সংকেত পুনর্নির্মাণ করে রৈখিক আনুমানিক ব্যবহার করে লক্ষ সংকেতের স্পেক্ট্রাম থেকে কোডারের কোয়ানটাইজেসন নোইসকে আকার দেয়, আংশিকভাবে মাস্ক করে।[২১]
অডিওর এবং ইন্টারেক্টিভ অ্যাপ্লিকেশনের (যেমন, সেল ফোনে ডিজিটাল প্রেরণের জন্য বক্তৃতার যে কোডিং) প্রবাহ বিতরণে হ্রাসমূলক ফরমেটগুলো প্রায়ই ব্যবহৃত হয়। এ ধরনের অ্যাপলিকেশনগুলোতে উপাত্ত অবশ্যই উপাত্ত হিসেবে সংকোচিত হতে হবে, বরং সম্পূর্ণ উপাত্ত সংকোচিত হয়ে যাওয়ার পর। সব অডিও কোডেক স্ট্রিমিং অ্যাপ্লিকেশনে ব্যবহার করা যায় না , এই ধরনের অ্যাপ্লিকেশনের জন্য স্ট্রিম প্রবাহকে সাধারণত কার্যবরীভাবে বাছাই করতে একটি কোডেক নকশা করা হয়।[২১]
পদ্ধতিগুলো থেকে পাওয়া অদৃশ্য ফলাফল উপাত্তকে এনকোড এবং ডিকোড করতে ব্যবহার করা হয়। কিছু কোডেক নিখুত কার্যকারিতার জন্য একটি লম্বা অংশ বিশ্লেষণ করবে। (প্রায়ই কোডেকগুলো এনকোড এবং ডিকোডের জন্য একটি একাধিক অংশ সৃষ্টি করে, যেগুলোকে "ফ্রেম" বলে)। কোডিং অ্যালগোরিদম -এর এই সহজাত অদৃশ্যতা জটিল হতে পারে; উদাহরণস্বরূপ, যখন উপাত্তের সেখানে একটি দুই-প্রণালীর ট্রান্সমিশন থাকে, যেমন একটি টেলিফোন ফোন আলাপের সাথে গুরুত্বপূর্ণ দেরি অনুভূত মানের অধঃপতন ঘটায়।
সংকোচনের গতির বিপরীত, যা অ্যালগোরিদমের প্রয়োজনীয় ক্রিয়ার সংখ্যার সাথে সমানুপাতিক। এখানে অদৃশ্যতা নির্দেশ করে অডিওর বাধা প্রক্রিয়াজাতের পূর্বে বিশ্লেষণীয় নমুনার সংখ্যা। সর্বনিম্নতা হচ্ছে শূন্য (যেমন, যদি কোডার/ডিকোডার উপাত্ত কোন্টাইজেশনের জন্য বিটের সংখ্যা হ্রাস করে)। সময় ডোমেন অ্যালগোরিদমগুলো যেমন, এলপিসিতেও প্রায়ই কম অদৃশ্যতা থাকতে পারে, অতঃপর তাদের জনপ্রিয়তা রয়েছে টেলিফোন আলাপের বক্তৃতা কোডিং -এ। অ্যালগোরিদম যেমন, এমপিথ্রি, যাহোক, একটি বিশাল সংখ্যক বিশ্লেষণীয় নমুনা ফ্রিকোয়েন্সি ডোমেনে একটি সাইকোকাষ্টিক নকশা, অদৃশ্যতা রয়েছে ২৩ এমএসের অাপদশের পরিপেক্ষিতে বাস্তবায়নের জন্য রয়েছে (দ্বিমাত্রিক যোগাযোগের জন্য ৪৬ এমএস)।
বক্তৃতা এনকোডিং
সম্পাদনাবক্তৃতা এনকোডিং অডিও উপাত্ত সংকোচনের একটি গুরুত্বপূর্ণ বিভাগ। প্রত্যক্ষজ নকশাগুলো মানুষের কান সাধারণত যা শুনতে পায় মিউজিক -এর সাথে কিছুটা পার্থক্য তা ধারণা করতে ব্যবহৃত হয়। ফ্রিকোয়েন্সির পরিসরকে মানুষের আওয়াজ সাধারণভাবে মিউজিকের যতটা প্রয়োজন তার চেয়ে অনেক সীমাবদ্ধভাবে বহন করে নিয়ে যাওয়া প্রয়োজন হতো, আর আওয়াজটি সাধারণত কম জটিল। ফলস্বরূপ, বক্তৃতা অল্প বিটরেট - এ উচ্চ মানে এনকোড করা যেতে পারে।
সংকোচনীয় উপাত্ত যদি অ্যানালগ হয় (যেমন, একটি ভোল্টেজ যা সময়ের সাথে ভিন্ন হয়) এটিকে ডিটিটাল করে সংখ্যায় প্রকাশ করতে কোয়ান্টাইজেশন নিযুক্ত হয় (সাধারণত পূর্ণসংখ্যামূলক)। এটি অ্যানালগ থেকে ডিজিটাল রুপান্তরকে নির্দেশিত করে। যদি পূর্ণসংখ্যাগুলো উভয় ৮ বিট কোনটাইজেশন দ্বারা উৎপন্ন হয়, তাহলে অ্যানালগ সংকেতের সম্পূর্ণ পরিসর ২৫৬ পূণর্সংখ্যাগুলোতে ভাগ হয়ে যায় এবং সংকেত মূল্য একটি ইন্টার্ভালে একই কোনটাইজ হয়ে যায়। যদি, ১৬-বিট পূর্ণসংখ্যা উৎপাদিত হয়, তাহলে অ্যানালগ সংকেতের পরিসর ৬৫৫৩৬ ইন্টার্ভালে ভাগ হয়ে যায়।
এই সম্পর্কটি উচ্চ রিসোলিউশনের মধ্যকার আপোষ স্পষ্ট করে (বিশাল সংখ্যক অ্যানালগ ইন্টার্ভাল) এবং উচ্চ সংকোচন (ছোট পূর্ণসংখ্যা উৎপাদিত হয়)। পৃথক বক্তৃতা সংকোচন পদ্ধতি দ্বারা কোয়ানটাইজেশনের এই অ্যাপলিকেশন ব্যবহৃত হয়। এটি সম্পন্ন, সাধারণভাবে, দুটি প্রবেশ পথের মিশ্রণের মাধ্যমে:
- শুধু আওয়াজ এনকোড করা যা, শুধুমাত্র মানবকন্ঠ দ্বারা তৈরি।
- মানুষের শ্রবণের সম্পূর্ণ পরিসরের অধিকতর শুধু একটি "বোধগম্য" আওয়াজ পুনর্নির্মাণ করার জন্য পর্যাপ্ত রেখে, সংকেতের বেশিরভাগ উপাত্ত দূরে ছুড়ে ফেলে দেয়। সম্ভবত, প্রথম দিকের অ্যালগোরিদমগুলো বক্তৃতা এনকোডিং এ ব্যবহৃত হয় ( এবং সাধারণ অডিং উপাত্ত সংকোচনে) এ লো অ্যালগোরিদম এবং ইউ লো অ্যালগোরিদম ছিল।
ইতিহাস
সম্পাদনাএকটি বিশাল বৈচিত্র্যের অডিও কোডিং এর জন্য আইইইইতে একটি সাহিত্যরচনা সংক্ষিপ্তসার ফেব্রুয়ারি ১৯৮৮ তে একটি যোগাযোগের বাছাই করা এলাকায় পদ্ধতি প্রকাশিত হয়। যখন সে সময়ের পূর্বের কাগজপত্র ছিল, এই সংগ্রহ সমাপ্তির সম্পূর্ণ বৈশিষ্ট্য নথিভূক্ত করেছে, কার্যকরী অডিও কোডারগুলো, প্রায় প্রত্যেকটি, প্রত্যক্ষজ (যেমন, মাস্কিং), কৌশল এবং কয়েক ধরনের ফ্রিকোয়েন্সি বিশ্লেষণ আর পেছনের শেষে নোইসলেস কোাডিং। গবেষণার উদ্দেশ্যে ভালো, পরিস্কার ডিজিটাল অডিও পাওয়ার অসুবিধায় কাগজগুলোর কয়েকটি লক্ষণীয় ছিল।[২৩] জেএসএসি প্রকাশণের অধিকাংশ, হয়ত সবাই না, এমপিইজি-১ অডিও কমিটিতে সক্রিয় ছিল।
অসকার বোনেল, ইউনিভার্সিটি অব কোয়েনোজ অ্যারেস এর প্রকৌশলী প্রফেসর, পৃথিবীর প্রথম স্বয়ংক্রিয় অডিও সংকোচন বিকশিত করেন।[২৪] ১৯৮৩ সালে, জটিল ব্যান্ডের মাস্কিং এ সাইকোকাষ্টিক নীতি ব্যবহার করা প্রথম প্রকাশিত হয়,[২৫] ১৯৬৭ সালে, সে সম্প্রতি বিকশিত আইবিএম পিসি কম্পিউটারের ব্যবহারিক অ্যাপ্লিকেশন বিকশিত করতে শুরু করেন, ব্রডকাষ্ট স্বয়ংক্রিয় পদ্ধতি ১৯৮৭ সালে একই নামে চালু হয়, অডিকম। বিশ বছর পরে, পৃথিবীরপ্রায় সকল রেডিও স্টেশন বিভিন্ন কোম্পানির তৈরি একই প্রযুক্তি ব্যবহার করছিল।
ভিডিও
সম্পাদনাভিডিও সংকোচন প্রাচূর্য হ্রাস করতে আধুনিক কোডিং কৌশলগুলো ব্যবহার করে। অধিকাংশ সংকোচন অ্যালগোরিদম এবং কোডেকগুলো দূরসংক্রান্ত ছবি সংকোচন এবং সময়গত গতি প্রতিদানের মিশ্রণ ঘটায়। ভিডিও সংকোচন তথ্য তত্ত্বের সোর্স কোডিং -এর ব্যবহারিক বাস্তবায়ন। প্রস্তুতিকালে, অধিকাংশ সংকোচন কোডেক ভিন্নতাকে সংকোচন করতে অডিও সংকোচন কৌশল সমান্তরালভাবে ব্যবহার করে, কিন্তু উপাত্ত প্রবাহগুলোকে একটি প্যাকেজে মিশ্রিত করে ফেলে।[২৬]
সংখ্যাগরিষ্ঠ ভিডিও সংকোচন অ্যালগোরিদম হ্রাসমূলক সংকোচন ব্যবহার করে। অসংকোচিত ভিডিওর একটি খুবই উচ্চ উপাত্ত হার প্রয়োজন হয়। যদিও হ্রাসহীন সংকোচন কোডেকগুলো একটি ৫-১২ এর গুণনীয়কে কাজ করে, একটি হ্রাসমূলক সংকোচন ভিডিওর ২০-২০০ এর মধ্যকার সংকোচন গুণনীয়ক থাকে।[২৭] যেমনটা, সকল হ্রাসমূলক সংকোচনে ভিডিওর মানের মধ্যে একটি ট্রেড-অফ থাকে, সংকোচন আর ডিকম্প্রেশন, এবং সিস্টেমের প্রয়োজনীয়তাগুলোর মূল্যে। উচ্চতর সংকোচিত ভিডিও দৃশ্যমান এবং বিক্ষেপণ আর্টিফেক্টগুলোকে উপস্থিত করেতে পারে।
কিছু ভিডিও কম্প্রেশন বর্গাকার পাশ্ববর্তী পিক্সেলের সমষ্টির উপর পরিচালনা করা হয়, আবার কখনো ম্যাক্রোব্লকগুলোতে। এই পিক্সেলের সমষ্টি আর পিক্সেলের ব্লকগুলোকে একটি ফ্রেম থেকে পরবর্তী ফ্রেমে তুলনা করা হয়, এবং ভিডিও সংকোচন কডেক ব্লকগুলোর মধ্যকার পার্থক্গুলো প্রেরণ করে। ভিডিওর বেশি গতির স্থানগুলোতে, বিশাল সংখ্যক পিক্সেল, যা পরিবর্তীত হচ্ছে তার সাথে বজায় থাকতে সংকোচনটিকে অবশ্যই বেশি উপাত্ত এনকোড করেতে হবে। সাধারণত বিস্ফোরণ, অগ্নিশিখা, পশুর পাল এবং কিছু পরিকল্পিত শটের সময় উচ্চ ফ্রিকোয়েন্সি বিবৃতি বিভিন্ন বিট-হারের মানের হ্রাস বা বৃদ্ধির দিকে নিয়ে যায়।
অন্যান্য পদ্ধতি, যেমন ফ্র্যাকটাল সংকোচন, অনুবৃত্তি মিলানো, বিযুক্ত ক্ষুদ্র তরঙ্গ ব্যবহার (ডিডাবলিউটি) কিছু গবেষণার বিষয় হয়েছে।
এনকোডিং তত্ত্ব
সম্পাদনাভিডিও উপাত্ত সংকোচন একটি সিরিজ হিসেবে পুনঃউপস্থাপিত হতে পারে তথাপি ছবি ফ্রেমে। ফ্রেমের ক্রম স্থানসংক্রান্ত এবং সময়গত অতিরেক ধারণ করে, যা ভিডিও সংকোচন অ্যালগরিদমগুলো বাদ দিতে বা ছোট আকারে কোড করতে চায়। সাদৃশ্যতা ফ্রেমের মধ্যকার পার্থক্যগুলো জমা রাখা বা মানুষের দৃষ্টির প্রত্যক্ষজ বৈশিষ্ট্যগুলোকে ব্যবহার করে। উদাহরণস্বরূপ রঙের ছোট পার্থক্যগুলো উজ্জ্বলতা পরিবর্তনের চেয়ে বোধগম্য করা কঠিন। সংকোচন অ্যালগরিদমগুলো সংরক্ষণের জায়গা হ্রাস করতে এই সংকেত এলাকাগুলো জুড়ে থাকা একটি রঙের গড় করতে পারে, একই পদ্ধতিতে, যা জেপিইজি ছবি সংকোচনে ব্যবহৃত হয়।[১০] এই পদ্ধতির কয়েকটি সহজাতভাবে হ্রাসমূলক যখন অন্যগুলো আসল সংকোচনমুক্ত ভিডিওর সকল প্রাসঙ্গিক তথ্য সংরক্ষিত করে।
ভিডিও সংকোচনের শক্তিশালী কৌশলগুলোর একটি হলো ইন্টারফ্রেম সংকোচন। ইন্টারফ্রেম সংকোচন এক বা তার আগের অথবা পরের ফ্রেম একটি ক্রমে ব্যবহার করে, কার্যকরী হচ্ছে ছবি সংকোচনে।[২৮]
সবচেয়ে শক্তিশালী ব্যবহৃত পদ্ধতিগুলো ভিডিওর প্রতিটি ফ্রেমের সাথে পূর্ববর্তী ফ্রেমের সাথে তুলনা করে কাজ করে। যদি এমন ভিডিও এমন স্থানগুলো বহন করে যেখানে কিছু সম্প্রসারণ করা হয়নি, তাহলে পদ্ধতিটি একটি সংক্ষিপ্ত নির্দেশ প্রেরণ করে যা পূর্ববর্তী ফ্রেমের অংশ অনুকরণ করে, বিটের জন্য বিট, পরেরটিতে। যদি ফ্রেমের শাখাগুলো একটি সাধারণ পদ্ধতিতে সম্প্রসারণ হয়, সংকোচকটি একটি (সামান্য দীর্ঘ) নির্দেশ প্রেরণ করে যা ডিকম্প্রেসরকে অনুকরণটি পরিবর্তন করতে, ঘুরাতে, আলোকিত বা অন্ধকার করতে বলে। এই দীর্ঘ আদেশ তাও ইন্টারফ্রেম সংকোচনের চেয়ে অনেক সংক্ষিপ্ত থেকে যায়। ইন্টারফ্রেম সংকোচন যেসব প্রোগ্রাম দর্শক দ্বারা প্লেব্যাক করা যেতে পারে সেগুলোতে ভালো কাজ করে, কিন্তু যেসব ভিডিও ক্রমের সংযোজন প্রয়োজন হয় সেগুলোতে সমস্যা সৃষ্টি করতে পারে।[২৯]
কারণ ইন্টারফ্রেম সংকোচন এক ফ্রেম থেকে অন্য ফ্রেম এর উপাত্ত অনুকরণ করে, যদি আসল ফ্রেম সাধারণভাবে কেটে যায় (প্রেরণের সময় হারিয়ে যায়), অনুসরণকারী ফ্রেমগুলো ঠিকমতো পুনর্নিমিত হয় না। কিছু ভিডিও সংকোচন যেমন, ডিভি, ইন্ট্রাফ্রেম সংকোচন ব্যবহার করে প্রত্যেকটি ফ্রেমকে স্বাধীনভাবে সংকোচন করে। ইন্ট্রাফ্রেম সংকোচিত ভিডিওতে কাট করা ততটাই সহজ যতটা সংকোচনমুক্ত ভিডিও সংযোজন করা: কেউ প্রতিটি ফ্রেমের শুরু এবং শেষ খোজে আর প্রতিটি ফ্রেমে যা সে রাখতে চায় বিটের-জন্য-বিট অনুকরণ করে এবং যে ফ্রেমগুলো রাখতে চায়না সেগুলো বাতিল করে। ইন্টারফ্রেম এবং ইন্ট্রাফ্রেম সংকোচনের আরেকটি পার্থক্য হচ্ছে, ইন্ট্রাফ্রেম পদ্ধতিতে, প্রত্যেকটি ফ্রেম একই পরিমাণ উপাত্ত ব্যবহার করে। অধিকাংশ ইন্ট্রাফ্রেম পদ্ধতিতে নির্দিষ্ট ফ্রেমগুলো (যেমন, "এমপিজি তে আই ফ্রেম) অন্য ফ্রেম থেকে উপাত্ত অনুকরণ করতে অনুমোদিত নয়, অতএব, তাদের নিকবর্তী অন্য ফ্রেমের চেয়ে বেশি উপাত্ত প্রয়োজন হয়।[২১]
আইফ্রেম সংযোজিত হওয়ার সময় সৃষ্ট সমস্যা ধরতে সক্ষম কম্পিউটার মূলীয় ভিডিও এডিটর তৈরি করা সম্ভব, যখন অন্য ফ্রেমগুলোরও তা দরকার। এটি নতুন ফরমেট যেমন, এইচডিভিকে ভিডিও সংযোজনে ব্যবহার করার অনুমোদিত করেছে। যাহোক, একই ছবির মানে ইন্টাফ্রেম সংকোচিত ভিডিও সংযোজনের চেয়ে প্রচুর বেশি গণনা করা শক্তি প্রক্রিয়াটি দাবী করে।
আজ প্রায় সব ভিডিও সংকোচন পদ্ধতি (যেমন, যেগুলো আইটিই-টি বা আইএসও দ্বারা মানসম্পন্ন অনুমোটিতগুলোর মধ্যে অন্তর্ভুক্ত) দূরত্ব-সংক্রান্ত বিয়োজ্য হ্রাসের জন্য বিযুক্ত কোসাইন্ রুপান্তর ব্যবহার করে। ডিসিটি যা এই বিবেচনায় বিশাল পরিসরে ব্যবহৃত হয় তা এন. আহমেদ, টি. নতরন্জন এবং কে. আর. রাও দ্বারা ১৯৭৪ সালে পরিচিতি লাভ করেছে।[৩০] অন্যান্য সংকোচন যেমন, ফ্রাক্টাল সংকোচন, অনুসরণ মিলানো বিযুক্ত তরঙ্গাকৃতি ব্যবহার কিছু গবেষণার বিষয় হয়েছিল, কিন্তু প্রয়োগিক পণ্যসমূহে ব্যবহার হয় না (স্টিল ছবি কোডার হিসেবে গতি প্রতিদান ছাড়া ক্ষুদ্র তরঙ্গে ব্যবহার ছাড়া)। ফ্র্যাক্টাল সংকোচনগুলোতে লাভ কমে আসছে, কারণ সাম্প্রতিক তত্ত্বীয় বিশ্লেষণগুলো দেখাচ্ছ যে, এই পদ্ধতিগুলোতে কার্যকারিতার অভাব রয়েছে।[২৮]
সময়রেখা
সম্পাদনানিম্নলিখিত ছকটি আন্তর্জাতিক ভিডিও সংকোচন মানের আংশিক ইতিহাস।
সাল | মান | প্রকাশক | জনপ্রিয় বাস্তবায়ন |
---|---|---|---|
১৯৮৪ | এইচ.১২০ | আইটিইউ-টি | |
১৯৮৮ | এইচ.২৬১ | আইটিইউ-টি | ভিডিও কনফারেন্সিং, ভিডিও টেলিফোনি |
১৯৯৩ | এমপিইজি-১ পর্ব ২ | আইএসও, আইইসি | ভিডিও-সিডি |
১৯৯৫ | এইচ.২৬২/এমপিইজি-২ পর্ব ২ | আইএসও, আইইসি, আইটিইউ-টি | ডিভিডি ভিডিও, ব্লু-রে, ডিজিটাল ভিডিও সম্প্রচার, এসভিসিডি |
১৯৯৬ | এইচ.২৬৩ | আইটিইউ-টি | ভিডিও কনফারেন্সিং, ভিডিও টেলিফোনি, মোবাইল ফোনে ভিডিও (৩ জিপি) |
১৯৯৯ | এমপিইজি-৪ পর্ব 2 | আইএসও, আইসি | ইন্টারনেটে ভিডিও (ডিআইভিএক্স, এক্সভিআইডি ...) |
২০০৩ | এইচ.২৬৪/এমপিইজি-৪ এভিসি | সনি, পেনাসনিক, স্যামসাং, আইএসও, আইইসি, আইটিইউ-টি | ব্লু-রে, এইচডি ভিডিও, ডিজিটাল ভিডিও সম্প্রচার, আইপড, অ্যাপেল টিভি, ভিডিও কনফারেন্সিং |
২০০৯ | ভিসি-২ (ডাইরেক) | এসএমপিটিই | ইন্টানেটে ভিডিও, এইচডি টিভি সম্প্রচার, ইউএইচডি টিভি |
২০১৩ | এইচ.২৬৫ | আইএসও, আইইসি, আইটিইউ-টি |
সৃষ্টি সম্বন্ধীয়
সম্পাদনাসৃষ্টি-সম্বন্ধীয় সংকোচন অ্যালগোরিদমগুলো হ্রাসহীন অ্যালগোরিদমগুলোর সবচেয়ে নতুন প্রজন্ম যা, উপাত্ত সংকোচন করে (সাধারণত নিউক্লিওটাইডের ক্রমে) নির্দিষ্ট উপাত্তটাইপের গ্রহণ করা প্রচলিত এবং সৃষ্টি-সম্বন্ধীয় অ্যালগোরিদমগুলো ব্যবহার করে। ২০১২ সালে, জনস হপকিন্স বিশ্ববিদ্যালয়ের এক দল বিজ্ঞানী একটি সৃষ্টি-সম্বন্ধীন সংকোচন অ্যালগোরিদম প্রকাশ করে যা, সংকোচনের জন্য কোনো নির্দেশক জিনোম ব্যবহার করে না। হ্যাপজিপার হ্যাপম্যাপ এবং ২০-ভাজের বেশি আর্কাইভ সংকোচন (ফাইলের আকারে ৯৫% হ্রাস), আসল সাধারণ সংকোচন ইউটিলিটিগুলোর চেয়ে দ্রুততর ২-৪-ভাজ জোগাড় করে। এজন্য, চান্ডা, এইহাক এবং ব্যাডার এমএএফ মূলীয় এনকোডিং (এমএএফই) -র সাথে পরিচয় করিয়ে দেন, ক্ষুদ্রতর অ্যালেল ফ্রিকোয়েন্সি দ্বারা এসএনএস- এর শ্রেণীবিভক্ত করে, এভাবে উপাত্ত সেটকে একই ধরনের করে।[৩১] ২০০৯ এবং ২০১৩ সালের অন্য অ্যালগোরিদমগুলোর (ডিএনএজিপ ও জিনোমজিপ) ১২০০-ভাজ পর্যন্ত সংকোচন অনুপাত আছে, যা ৬ বিলিয়ন বেসপ্যায়ার ডিপ্লয়েড মানব জিনোমকে ২.৫ মেগাবাইটে সংরক্ষিত হতে অনুমোদিত করে (একটি নির্দেশক জিনোমের সাথে সম্পর্কিত এবং অনেকগুলো জিনোমের গড়)।[৩২][৩৩]
অনুকরণ
সম্পাদনাসিডি-মূলীয় কনসোল যেমন, প্লেস্টেশন ২ অনুকরণ করতে, আইএসও দ্বারা ব্যবহৃত ডিস্কের সংরক্ষণের জায়গা বিশাল পরিমানে কমিয়ে আনার জন্য উপাত্ত সংকোচন আকাঙ্ক্ষণীয়। উদাহরণস্বরূপ, ফাইনাল ফ্যান্টাসি ২.৯ গিগাবাইট। সঠিক সংকোচনে এটি হ্রাসপ্রাপ্ত হয়ে এর আকারের ৯০% হয়ে যায়।[৩৪]
দৃষ্টিভঙ্গি এবং বর্তমানে অব্যবহৃত সম্ভাবনা
সম্পাদনাএটি ধারণা করা হয় যে, বর্তমানে পৃথিবীর স্টোরেজ ডিভাইসগুলোতে সংরক্ষিত সম্পূর্ণ পরিমাণ উপাত্ত একটি অবশিষ্ট গড় গুণনীয়ক ৪.৫:১ [তথ্যসূত্র প্রয়োজন] দ্বারা বিদ্যমান সংকোচন অ্যালগোরিদমগুলোর মাধ্যমে আরো সংকোচিত হতে পারত। এটি অনুমাণ করা হয় ২০০৭ সালে, পৃথিবীর সম্বনিত তথ্য সংরক্ষণের ক্ষমতা হার্ডওয়্যার ডিজিটের ১,৩০০ এক্সাবাইট প্রদান করত। কিন্তু, যখন অনুরূপ কন্টেন্টগুলো সন্তোষজনক ভাবে সংকোচিত হয়, এটি শুধু শ্যানন তথ্যের ২৩৬ এক্সাবাইট উপস্থাপন করে। [৩৫]
আরও দেখুন
সম্পাদনাতথ্যসূত্র
সম্পাদনা- ↑
Wade, Graham (১৯৯৪)। Signal coding and processing (2 সংস্করণ)। Cambridge University Press। পৃষ্ঠা 34। আইএসবিএন 978-0-521-42336-6। সংগ্রহের তারিখ ২০১১-১২-২২।
The broad objective of source coding is to exploit or remove 'inefficient' redundancy in the PCM source and thereby achieve a reduction in the overall source rate R.
- ↑ ক খ Mahdi, O.A.; Mohammed, M.A.; Mohamed, A.J. (নভেম্বর ২০১২)। "Implementing a Novel Approach an Convert Audio Compression to Text Coding via Hybrid Technique" (পিডিএফ)। International Journal of Computer Science Issues। 9 (6, No. 3): 53–59। ২৮ ডিসেম্বর ২০১৮ তারিখে মূল (পিডিএফ) থেকে আর্কাইভ করা। সংগ্রহের তারিখ ৬ মার্চ ২০১৩।
- ↑ Pujar, J.H.; Kadlaskar, L.M. (মে ২০১০)। "A New Lossless Method of Image Compression and Decompression Using Huffman Coding Techniques" (পিডিএফ)। Journal of Theoretical and Applied Information Technology। 15 (1): 18–23। ২৮ ডিসেম্বর ২০১৮ তারিখে মূল (পিডিএফ) থেকে আর্কাইভ করা। সংগ্রহের তারিখ ২৮ মার্চ ২০১৮।
- ↑ Salomon, David (২০০৮)। A Concise Introduction to Data Compression। Berlin: Springer। আইএসবিএন 9781848000728।
- ↑ S. Mittal; J. Vetter (২০১৫), "A Survey Of Architectural Approaches for Data Compression in Cache and Main Memory Systems", IEEE Transactions on Parallel and Distributed Systems, IEEE
- ↑ Tank, M.K. (২০১১)। Implementation of Limpel-Ziv algorithm for lossless compression using VHDL। Thinkquest 2010: Proceedings of the First International Conference on Contours of Computing Technology। Berlin: Springer। পৃষ্ঠা 275–283।
- ↑ Navqi, Saud; Naqvi, R.; Riaz, R.A.; Siddiqui, F. (এপ্রিল ২০১১)। "Optimized RTL design and implementation of LZW algorithm for high bandwidth applications" (পিডিএফ)। Electrical Review। 2011 (4): 279–285।
- ↑ ক খ গ Wolfram, Stephen (২০০২)। A New Kind of Science। Wolfram Media, Inc.। পৃষ্ঠা 1069। আইএসবিএন 1-57955-008-8।
- ↑ ক খ Mahmud, Salauddin (মার্চ ২০১২)। "An Improved Data Compression Method for General Data" (পিডিএফ)। International Journal of Scientific & Engineering Research। 3 (3): 2। ২৮ ডিসেম্বর ২০১৮ তারিখে মূল (পিডিএফ) থেকে আর্কাইভ করা। সংগ্রহের তারিখ ৬ মার্চ ২০১৩।
- ↑ ক খ Lane, Tom। "JPEG Image Compression FAQ, Part 1"। Internet FAQ Archives। Independent JPEG Group। সংগ্রহের তারিখ ৬ মার্চ ২০১৩।
- ↑ G. J. Sullivan; J.-R. Ohm; W.-J. Han; T. Wiegand (ডিসেম্বর ২০১২)। "Overview of the High Efficiency Video Coding (HEVC) Standard" (PDF)। IEEE Transactions on Circuits and Systems for Video Technology। IEEE। 22 (12)। সংগ্রহের তারিখ ২০১৭-০৮-১২।
- ↑ Marak, Laszlo। "On image compression" (পিডিএফ)। University of Marne la Vallee। ২৮ মে ২০১৫ তারিখে মূল (পিডিএফ) থেকে আর্কাইভ করা। সংগ্রহের তারিখ ৬ মার্চ ২০১৩।
- ↑ Mahoney, Matt। "Rationale for a Large Text Compression Benchmark"। Florida Institute of Technology। ১৮ আগস্ট ২০০৬ তারিখে মূল থেকে আর্কাইভ করা। সংগ্রহের তারিখ ৫ মার্চ ২০১৩।
- ↑ Shmilovici A.; Kahiri Y.; Ben-Gal I.; Hauser S.। "Measuring the Efficiency of the Intraday Forex Market with a Universal Data Compression Algorithm" (PDF)। Computational Economics, Vol. 33 (2), 131-154., 2009।
- ↑ I. Ben-Gal। "On the Use of Data Compression Measures to Analyze Robust Designs" (পিডিএফ)। IEEE Trans. on Reliability, Vol. 54, no. 3, 381-388, 2008। ২৬ সেপ্টেম্বর ২০২০ তারিখে মূল (PDF) থেকে আর্কাইভ করা। সংগ্রহের তারিখ ২৯ মার্চ ২০১৮।
- ↑ Scully and Brodley, D. and Carla E. (২০০৬)। "Compression and machine learning: A new perspective on feature space vectors" (পিডিএফ)। Data Compression Conference, 2006। ৮ মার্চ ২০১৮ তারিখে মূল (পিডিএফ) থেকে আর্কাইভ করা। সংগ্রহের তারিখ ২৯ মার্চ ২০১৮।
- ↑ Korn, D.; ও অন্যান্য। "RFC 3284: The VCDIFF Generic Differencing and Compression Data Format"। Internet Engineering Task Force। সংগ্রহের তারিখ ৫ মার্চ ২০১৩।
- ↑ Korn, D.G.; Vo, K.P. (১৯৯৫), B. Krishnamurthy, সম্পাদক, Vdelta: Differencing and Compression, Practical Reusable Unix Software, New York: John Wiley & Sons, Inc.
- ↑ The Olympus WS-120 digital speech recorder, according to its manual, can store about 178 hours of speech-quality audio in .WMA format in 500MB of flash memory.
- ↑ Coalson, Josh। "FLAC Comparison"। সংগ্রহের তারিখ ৬ মার্চ ২০১৩।
- ↑ ক খ গ ঘ Jaiswal, R.C. (২০০৯)। Audio-Video Engineering। Pune, Maharashtra: Nirali Prakashan। পৃষ্ঠা 3.41। আইএসবিএন 9788190639675।
- ↑ Faxin Yu; Hao Luo; Zheming Lu (২০১০)। Three-Dimensional Model Analysis and Processing। Berlin: Springer। পৃষ্ঠা 47। আইএসবিএন 9783642126512।
- ↑ "File Compression Possibilities"। A Brief guide to compress a file in 4 different ways। ১৩ মার্চ ২০১৮ তারিখে মূল থেকে আর্কাইভ করা। সংগ্রহের তারিখ ২৯ মার্চ ২০১৮।
- ↑ "Summary of some of Solidyne's contributions to Broadcast Engineering"। Brief History of Solidyne। Buenos Aires: Solidyne। ৮ মার্চ ২০১৩ তারিখে মূল থেকে আর্কাইভ করা। সংগ্রহের তারিখ ৬ মার্চ ২০১৩।
- ↑ Zwicker, Eberhard; ও অন্যান্য (১৯৬৭)। The Ear As A Communication Receiver। Melville, NY: Acoustical Society of America। ১৪ সেপ্টেম্বর ২০০০ তারিখে মূল থেকে আর্কাইভ করা। সংগ্রহের তারিখ ২৯ নভেম্বর ২০১৮।
- ↑ "Video Coding"। Center for Signal and Information Processing Research। Georgia Institute of Technology। ২৩ মে ২০১৩ তারিখে মূল থেকে আর্কাইভ করা। সংগ্রহের তারিখ ৬ মার্চ ২০১৩।
- ↑ Graphics & Media Lab Video Group (২০০৭)। Lossless Video Codecs Comparison (পিডিএফ)। Moscow State University।
- ↑ ক খ Faxin Yu; Hao Luo; Zheming Lu (২০১০)। Three-Dimensional Model Analysis and Processing। Berlin: Springer। পৃষ্ঠা 47। আইএসবিএন 9783642126512।
- ↑ Bhojani, D.R.। "4.1 Video Compression" (পিডিএফ)। Hypothesis। ১০ মে ২০১৩ তারিখে মূল (পিডিএফ) থেকে আর্কাইভ করা। সংগ্রহের তারিখ ৬ মার্চ ২০১৩।
- ↑ Ahmed, N.; Natarajan, T.; Rao, K.R. (জানুয়ারি ১৯৭৪)। "Discrete Cosine Transform"। IEEE Transactions on Computers। C–23 (1): 90–93। ডিওআই:10.1109/T-C.1974.223784।
- ↑ Chanda P, Bader JS, Elhaik E; Elhaik; Bader (২৭ জুলাই ২০১২)। "HapZipper: sharing HapMap populations just got easier" (পিডিএফ)। Nucleic Acids Research। 40 (20): e159। ডিওআই:10.1093/nar/gks709। পিএমআইডি 22844100। পিএমসি 3488212 ।
- ↑ Christley S, Lu Y, Li C, Xie X; Lu; Li; Xie (জানু ১৫, ২০০৯)। "Human genomes as email attachments"। Bioinformatics। 25 (2): 274–5। ডিওআই:10.1093/bioinformatics/btn582। পিএমআইডি 18996942।
- ↑ Pavlichin DS, Weissman T, Yona G; Weissman; Yona (সেপ্টেম্বর ২০১৩)। "The human genome contracts again"। Bioinformatics। 29 (17): 2199–202। ডিওআই:10.1093/bioinformatics/btt362। পিএমআইডি 23793748।
- ↑ PCSX2 team (জানুয়ারি ৮, ২০১৬)। "1.4.0 released! Year end report"। এপ্রিল ২০, ২০১৩ তারিখে মূল থেকে আর্কাইভ করা। সংগ্রহের তারিখ এপ্রিল ২৭, ২০১৬।
- ↑ Hilbert, Martin; López, Priscila (১ এপ্রিল ২০১১)। "The World's Technological Capacity to Store, Communicate, and Compute Information"। Science। 332 (6025): 60–65। ডিওআই:10.1126/science.1200970। পিএমআইডি 21310967। বিবকোড:2011Sci...332...60H। সংগ্রহের তারিখ ৬ মার্চ ২০১৩।
বহিঃসংযোগ
সম্পাদনা- Data Compression Basics (Video)
- Video compression 4:2:2 10-bit and its benefits
- Why does 10-bit save bandwidth (even when content is 8-bit)?
- Which compression technology should be used
- Wiley - Introduction to Compression Theory
- EBU subjective listening tests on low-bitrate audio codecs
- Audio Archiving Guide: Music Formats (Guide for helping a user pick out the right codec)
- "MPEG 1&2 video compression intro (pdf format)" (পিডিএফ)। সেপ্টেম্বর ২৮, ২০০৭ তারিখে মূল (পিডিএফ) থেকে আর্কাইভ করা। সংগ্রহের তারিখ মার্চ ২৯, ২০১৮।
- hydrogenaudio wiki comparison
- Introduction to Data Compression by Guy E Blelloch from CMU
- HD Greetings - 1080p Uncompressed source material for compression testing and research
- Explanation of lossless signal compression method used by most codecs
- Interactive blind listening tests of audio codecs over the internet
- TestVid - 2,000+ HD and other uncompressed source video clips for compression testing
- Videsignline - Intro to Video Compression
- Data Footprint Reduction Technology[স্থায়ীভাবে অকার্যকর সংযোগ]