Збивање на слики

Од Википедија — слободната енциклопедија

Збивање на слики е еден вид компресија на податоци што се применува на дигиталните слики, за да ги намалат нивните трошоци за складирање или пренесување . Алгоритмите можат да ги искористат предностите на визуелната перцепција и статистичките својства на податоците за слики за да обезбедат супериорни резултати во споредба со генеричките методи за компресија на податоците што се користат за други дигитални податоци.[1]

Споредба на JPEG слики зачувани од Adobe Photoshop на различни нивоа на квалитет и со или без "зачувај за на мрежно место (web)"

Збивање со загуби и без загуби на слика[уреди | уреди извор]

Збивањето на сликата може да биде со загуба или без загуба. Збивањето без загуба е најпосакувана за архивски цели и честопати за медицински слики, технички цртежи, клип-уметност или стрипови. Методите збивање со загуба, особено кога се користат со ниски стапки на бит, воведуваат артефакти за компресија. Методите на губење се особено погодни за природни слики, како што се фотографии во апликации каде што мало (понекогаш незабележливо) губење на верност е прифатливо за да се постигне значително намалување на стапката на бит. Загубената компресија што произведува незначителни разлики може да се нарече визуелно без загуба.

Методи за слаби компресија :

  • Трансформација на кодирање - Ова е најчесто користениот метод.
    • Дискретна козметичка трансформација (DCT) - Најшироко користена форма на губиток на компресија. Тој е еден вид трансформација поврзана со Фјуриер и првично беше развиен од Насир Ахмед, Т. Натарајан и К.Р. Рао во 1974 година.[2] DCT понекогаш се нарекува „DCT-II“ во контекст на семејство на дискретни косинусни трансформации (види дискретна косинусна трансформација ). Тоа е генерално најефикасната форма на компресија на слика.
      • DCT се користи во JPEG, најпопуларен формат на загуба и најновата HEIF .
    • Неодамна развиената трансформација на бранова лента се користи и опширно, проследено со квантификација и кодирање на ентропија .
  • Намалување на просторот за боја на најчестите бои на сликата. Избраните бои се наведени во палетата на бои во заглавието на компресираната слика. Секој пиксел само упатува на индекс на боја од палетата на бои, овој метод може да се комбинираат со колебање за да се избегне на постери .
  • Навлегување на хрома . Ова го искористува фактот дека човечкото око поостро ги перцепира просторните промени на осветленоста од оние на бојата, со просек или испуштање на некои од информациите за хроминанс на сликата.
  • Фрактална компресија .

Методи за компресија без загуби :

  • Кодирање со должина на траење - се користи во стандарден метод во PCX и како што е можно во BMP, TGA, TIFF
  • Компресија на слика на површина
  • Предвидливо кодирање - се користи во DPCM
  • Кодирање на ентропија - двете најчести техники за кодирање на ентропија се аритметичко кодирање и кодирање на Хафман
  • Алгоритми за прилагодување речник како што се LZW - користени во GIF и TIFF
  • ДЕФЛАТ - се користи во PNG, MNG и TIFF
  • Шифри за синџири

Други својства[уреди | уреди извор]

Најдобриот квалитет на сликата по дадена стапка на компресија (или стапка на бит) е главната цел на компресија на слики, сепак, постојат и други важни својства на шемите за компресија на сликата:

Приспособливоста главно се однесува на намалување на квалитетот постигнат со манипулација со битстрим или податотека (без декомпресија и повторна компресија). Другите имиња за приспособливост се прогресивно кодирање или вградени бистреми . И покрај неговата спротивна природа, приспособливоста може да се најде и во кодеци без загуба, обично во форма на груби до фини пиксели скенови. Приспособливоста е особено корисна за прегледување на слики додека ги преземате (на пр., Во прелистувач) или за обезбедување пристап до варијабилен квалитет на пр., До базите на податоци. Постојат неколку видови на приспособливост:

  • Прогресивен квалитет или прогресивен слој: Битстрим последователно ја рафинира реконструираната слика.
  • Прогресивна резолуција : Прво кодирајте пониска резолуција на слика; потоа кодирајте ја разликата во повисоки резолуции.[3][4]
  • Прогресивна компонента : Прва кодирана верзија со сива скала; потоа додавајќи целосна боја.

Регистрација на интерес за кодирање . Одредени делови на сликата се кодираат со повисок квалитет од другите. Ова може да се комбинира со приспособливост (прво кодирајте ги овие делови, други подоцна).

Мета информации . Компресираните податоци може да содржат информации за сликата што може да се користи за категоризација, пребарување или прегледување на слики. Таквите информации може да вклучуваат статистика на боја и текстура, слики со мал преглед и информации за автор или авторски права.

Моќ за обработка . Алгоритмите за компресија бараат различни количини на моќ на обработка за да се кодираат и декодираат. Некои алгоритми со висока компресија бараат голема моќ на обработка.

Квалитетот на методот на компресија често се мери со врвниот врв сигнал - бучава . Тој ја мери количината на бучава воведена преку загубаста компресија на сликата, меѓутоа, субјективната проценка на гледачот, исто така, се смета за важна мерка, можеби, најважната мерка.

Историја[уреди | уреди извор]

Кодирањето на ентропија започнала во 1940-тите со воведувањето на Шенон-Фано кодирањето,[5] основа за кодирање на Хафман, која била развиена во 1950 година.[6] Кодирањето на трансформацијата датира од крајот на 1960-тите, со воведување брз кодирање на брзо фуриевата трансформација (FFT) во 1968 година и хадамардовата трансформација во 1969 година.[7]

Важен развој во компресијата на податоците за слики беше дискретниот косинус трансформатор (DCT), техника на збивање со загуба за првпат предложена од Насир Ахмед во 1972 година.[8] DCT компресијата стана основа за JPEG, што била воведена од страна на Здружената група за експерти за фотографирање (JPEG) во 1992 година.[9] JPEG ги компресира сликите до многу помали димензии на податотеки и станала најшироко користен формат на податотека со слики.[10] Неговиот високо ефикасен алгоритам за компресија на DCT во голема мерка е одговорен за широко размножување на дигитални слики и дигитални фотографии,[11] со неколку милијарди JPEG слики произведени секој ден од 2015 година.[12]

Лемпел-Зив-Велч (LZW) бил алгоритам за збивање без загуби, развиен од Абрахам Лемпел, Џејкоб Зив и Тери Велч во 1984 година. Тој се користел во форматот GIF, воведен во 1987 година. DEFLATE, алгоритам за збивање без загуби развиен од Фил Катц и наведен во 1996 година, се користи во форматот Подвижна мрежна графика (PNG).

Брановитото кодирање (Wavelet), употребата на брановити преобразби во збивањето на сликата, започнало по развојот на DCT кодирањето.[13] Воведувањето на DCT довело до развој на кодирање на бранови, варијанта на DCT-кодирање што користело бранови наместо алгоритмот заснован на блокови на DCT. Стандардот JPEG 2000 бил развиен од 1997 до 2000 година од страна на комитет JPEG со кој претседаваше Тураџ Ебрахими (подоцна претседател на JPEG).[14] За разлика од алгоритмот DCT користен од оригиналниот JPEG формат, JPEG 2000 наместо тоа користи дискретни алгоритми за преобразба на бранови (DWT). Тој ја користел на CDF 9/7 брановитата преобразба (развиена од Ингрид Добеши во 1992 година) за нејзиниот алгоритам на збивање со загуба,[15] и трансформацијата на брановите LeGall-Tabatabai (LGT) 5/3[16][17] (развиен од Дидје Ле Гал и Али Ј Табабабаи во 1988 година) [18] за неговиот алгоритам за компресија без загуби. Технологијата JPEG 2000, која вклучувало продолжување Motion JPEG 2000, била избран за стандард за видео-кодирање за дигиталното кино во 2004 година.[19]

Белешки и наводи[уреди | уреди извор]

  1. „Image Data Compression“.
  2. Nasir Ahmed, T. Natarajan and K. R. Rao, "Discrete Cosine Transform Архивирано на 25 ноември 2011 г.," IEEE Trans. Computers, 90–93, Jan. 1974.
  3. Burt, P.; Adelson, E. (1 April 1983). „The Laplacian Pyramid as a Compact Image Code“. IEEE Transactions on Communications. 31 (4): 532–540. CiteSeerX 10.1.1.54.299. doi:10.1109/TCOM.1983.1095851.
  4. Shao, Dan; Kropatsch, Walter G. (3–5 февруари 2010). Špaček, Libor; Franc, Vojtěch (уред.). „Irregular Laplacian Graph Pyramid“ (PDF). Computer Vision Winter Workshop 2010. Nové Hrady, Czech Republic: Czech Pattern Recognition Society.CS1-одржување: датумски формат (link)
  5. Claude Elwood Shannon (1948). „A Mathematical Theory of Communication“ (PDF). Bell System Technical Journal. 27 (3–4). Посетено на 2019-04-21.
  6. David Albert Huffman (септември 1952), „A method for the construction of minimum-redundancy codes“ (PDF), Proceedings of the IRE, 40 (9), стр. 1098–1101, doi:10.1109/JRPROC.1952.273898
  7. William K. Pratt, Julius Kane, Harry C. Andrews: "Hadamard transform image coding", in Proceedings of the IEEE 57.1 (1969): Seiten 58–68
  8. Ahmed, Nasir (јануари 1991). „How I Came Up With the Discrete Cosine Transform“. Digital Signal Processing. 1 (1): 4–5. doi:10.1016/1051-2004(91)90086-Z.
  9. „T.81 – DIGITAL COMPRESSION AND CODING OF CONTINUOUS-TONE STILL IMAGES – REQUIREMENTS AND GUIDELINES“ (PDF). CCITT. септември 1992. Посетено на 22 јули 2020.
  10. „The JPEG image format explained“. BT.com. BT Group. 31 May 2018. Архивирано од изворникот на 2019-08-05. Посетено на 22 февруари 2020.
  11. „What Is a JPEG? The Invisible Object You See Every Day“. The Atlantic. 24 септември 2013. Посетено на 22 февруари 2020.
  12. Baraniuk, Chris (15 октомври 2015). „Copy protections could come to JPEGs“. BBC News. BBC. Посетено на 22 февруари 2020.
  13. Hoffman, Roy (2012). Data Compression in Digital Systems. Springer Science & Business Media. стр. 124. ISBN 9781461560319. Basically, wavelet coding is a variant on DCT-based transform coding that reduces or eliminates some of its limitations. (...) Another advantage is that rather than working with 8 × 8 blocks of pixels, as do JPEG and other block-based DCT techniques, wavelet coding can simultaneously compress the entire image.
  14. Taubman, David; Marcellin, Michael (2012). JPEG2000 Image Compression Fundamentals, Standards and Practice: Image Compression Fundamentals, Standards and Practice. Springer Science & Business Media. ISBN 9781461507994.
  15. Unser, M.; Blu, T. (2003). „Mathematical properties of the JPEG2000 wavelet filters“ (PDF). IEEE Transactions on Image Processing. 12 (9): 1080–1090. doi:10.1109/TIP.2003.812329. PMID 18237979. Архивирано од изворникот (PDF) на 2019-10-13. Посетено на 2020-02-22.
  16. Sullivan, Gary (8–12 декември 2003). „General characteristics and design considerations for temporal subband video coding“. ITU-T. Video Coding Experts Group. Посетено на 22 февруари 2020.CS1-одржување: датумски формат (link)
  17. Bovik, Alan C. (2009). The Essential Guide to Video Processing. Academic Press. стр. 355. ISBN 9780080922508.
  18. Gall, Didier Le; Tabatabai, Ali J. (1988). „Sub-band coding of digital images using symmetric short kernel filters and arithmetic coding techniques“. ICASSP-88., International Conference on Acoustics, Speech, and Signal Processing: 761–764 vol.2. doi:10.1109/ICASSP.1988.196696.
  19. Swartz, Charles S. (2005). Understanding Digital Cinema: A Professional Handbook. Taylor & Francis. стр. 147. ISBN 9780240806174.

Надворешни врски[уреди | уреди извор]