문자가 utf-8 인코딩 일 때 4kb에 몇 개의 문자를 저장할 수 있습니까?
답변
UTF-8에서 문자는 1 ~ 4 바이트가 필요합니다. 따라서 4KB의 UTF-8 문자를 각각 4096에서 1024까지 저장할 수 있습니다.
많은 사용 사례에서 대부분의 문자가 1 바이트에 들어가고 거의 모두 2 바이트에 들어갈 것으로 예상 할 수 있다고 가정합니다.
답변
다음은 1024 또는 4096 이 얼마나 많은지 시각적 단서 입니다. 더 나은 이해를 위해 @Jon Snyder의 메시지를 읽으십시오.
1024 자 (문자가 4 바이트라고 가정) :
Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Aenean commodo ligula eget dolor. Aenean massa. Cum sociis natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Donec quam felis, ultricies nec, pellentesque eu, pretium quis, sem. Nulla consequat massa quis enim. Donec pede justo, fringilla vel, aliquet nec, vulputate eget, arcu. enim justo, rhoncus ut, imperdiet a, venenatis vitae, justo. Nullam dictum felis eu pede mollis pretium. 정수 tincidunt. Cras dapibus. Vivamus elementum semper nisi. Aenean vulputate eleifend tellus. Aenean leo ligula, porttitor eu, consequat vitae, eleifend ac, enim. Aliquam lorem ante, dapibus in, viverra quis, feugiat a, tellus. Phasellus viverra nulla ut metus varius laoreet. Quisque rutrum. Aenean imperdiet. Etiam ultricies nisi vel augue. Curabitur ullamcorper ultricies nisi. Nam eget dui. Etiam rhoncus. Maecenas tempus, tellus eget condimentum rhoncus, sem quam semper libero, sit amet adipiscing sem neque sed ipsum. Nam quam nunc, blandit ve
4096 자 (문자가 1 바이트라고 가정) :
Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Aenean commodo ligula eget dolor. Aenean massa. Cum sociis natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Donec quam felis, ultricies nec, pellentesque eu, pretium quis, sem. Nulla consequat massa quis enim. Donec pede justo, fringilla vel, aliquet nec, vulputate eget, arcu. enim justo, rhoncus ut, imperdiet a, venenatis vitae, justo. Nullam dictum felis eu pede mollis pretium. 정수 tincidunt. Cras dapibus. Vivamus elementum semper nisi. Aenean vulputate eleifend tellus. Aenean leo ligula, porttitor eu, consequat vitae, eleifend ac, enim. Aliquam lorem ante, dapibus in, viverra quis, feugiat a, tellus. Phasellus viverra nulla ut metus varius laoreet. Quisque rutrum. Aenean imperdiet. Etiam ultricies nisi vel augue. Curabitur ullamcorper ultricies nisi. Nam eget dui. Etiam rhoncus. Maecenas tempus, tellus eget condimentum rhoncus, sem quam semper libero, sit amet adipiscing sem neque sed ipsum. Nam quam nunc, blandit vel, luctus pulvinar, hendrerit id, lorem. Maecenas nec odio et ante tincidunt tempus. Donec vitae sapien ut libero venenatis faucibus. Nullam quis ante. Etiam sit amet orci eget eros faucibus tincidunt. 듀스 레오. Sed fringilla mauris는 amet nibh에 앉아 있습니다. Donec sodales sagittis magna. Sed consequat, leo eget bibendum sodales, augue velit cursus nunc, quis gravida magna mi a libero. Fusce vulputate eleifend sapien. Vestibulum purus quam, scelerisque ut, mollis sed, nonummy id, metus. Nullam accumsan lorem in dui. Cras ultricies mi eu turpis hendrerit fringilla. faucibus orci luctus et ultrices posuere cubilia Curae의 Vestibulum ante ipsum primis; ac dui quis mi consectetuer lacinia에서. Nam pretium turpis et arcu. Duis arcu tortor, suscipit eget, imperdiet nec, imperdiet iaculis, ipsum. Sed aliquam ultrices mauris. Integer ante arcu, accumsan a, consectetuer eget, posuere ut, mauris. Praesent adipiscing. Phasellus ullamcorper ipsum rutrum nunc. Nunc nonummy metus. Vestibulum volutpat pretium libero. Cras id dui. Aenean ut eros et nisl sagittis vestibulum. Nullam nulla eros, ultricies sit amet, nonummy id, imperdiet feugiat, pede. Sed lectus. Donec mollis hendrerit risus. pellentesque facilisis의 Phasellus nec sem. Etiam imperdiet imperdiet orci. Nunc nec neque. Phasellus leo dolor, tempus non, auctor et, hendrerit quis, nisi. Curabitur ligula sapien, tincidunt non, euismod vitae, posuere imperdiet, leo. Maecenas malesuada. Massa에서 칭찬 콩가 시대. Sed cursus turpis vitae tortor. Donec posuere vulputate arcu. Phasellus는 cursus velit을 축적합니다. faucibus orci luctus et ultrices posuere cubilia Curae의 Vestibulum ante ipsum primis; Sed aliquam, nisi quis porttitor congue, elit erat euismod orci, ac placerat dolor lectus quis orci. Phasellus consectetuer vestibulum elit. Aenean tellus metus, bibendum sed, posuere ac, mattis non, nunc. Vestibulum fringilla pede sit amet augue. Turpis에서. Pellentesque posuere. Praesent turpis. Aenean posuere, tortor sed cursus feugiat, nunc augue blandit nunc, eu sollicitudin urna dolor sagittis lacus. Donec elit libero, sodales nec, volutpat a, suscipit non, turpis. Nullam sagittis. Suspendisse pulvinar, augue ac venenatis condimentum, sem libero volutpat nibh, nec pellentesque velit pede quis nunc. faucibus orci luctus et ultrices posuere cubilia Curae의 Vestibulum ante ipsum primis; 푸스 이드 푸 루스. Ut varius tincidunt libero. Phasellus dolor. Maecenas vestibulum mollis diam. Pellentesque ut neque. Pellentesque habitant morbi tristique senectus et netus et malesuada fames ac turpis egestas. in dui magna, posuere eget, vestibulum et, tempor auctor, justo. ac felis quis tortor malesuada pretium에서. Pellentesque auctor neque nec urna. Proin sapien ipsum, porta a, auctor quis, euismod ut, mi. Aenean viverra rhoncus pede. Pellentesque habitant morbi tristique senectus et netus et malesuada fames ac turpis egestas. Ut non enim eleifend felis pretium feugiat. Vivamus quis mi. Phasellus a est. Phasellus magna. Hac habitasse platea dictumst. lacus ac velit ornare lobortis의 Curabitur. 큐라 Pellentesque habitant morbi tristique senectus et netus et malesuada fames ac turpis egestas. in dui magna, posuere eget, vestibulum et, tempor auctor, justo. ac felis quis tortor malesuada pretium에서. Pellentesque auctor neque nec urna. Proin sapien ipsum, porta a, auctor quis, euismod ut, mi. Aenean viverra rhoncus pede. Pellentesque habitant morbi tristique senectus et netus et malesuada fames ac turpis egestas. Ut non enim eleifend felis pretium feugiat. Vivamus quis mi. Phasellus a est. Phasellus magna. Hac habitasse platea dictumst. lacus ac velit ornare lobortis의 Curabitur. 큐라 Pellentesque habitant morbi tristique senectus et netus et malesuada fames ac turpis egestas. in dui magna, posuere eget, vestibulum et, tempor auctor, justo. ac felis quis tortor malesuada pretium에서. Pellentesque auctor neque nec urna. Proin sapien ipsum, porta a, auctor quis, euismod ut, mi. Aenean viverra rhoncus pede. Pellentesque habitant morbi tristique senectus et netus et malesuada fames ac turpis egestas. Ut non enim eleifend felis pretium feugiat. Vivamus quis mi. Phasellus a est. Phasellus magna. Hac habitasse platea dictumst. lacus ac velit ornare lobortis의 Curabitur. 큐라 Pellentesque habitant morbi tristique senectus et netus et malesuada fames ac turpis egestas. Ut non enim eleifend felis pretium feugiat. Vivamus quis mi. Phasellus a est. Phasellus magna. Hac habitasse platea dictumst. lacus ac velit ornare lobortis의 Curabitur. 큐라 Pellentesque habitant morbi tristique senectus et netus et malesuada fames ac turpis egestas. Ut non enim eleifend felis pretium feugiat. Vivamus quis mi. Phasellus a est. Phasellus magna. Hac habitasse platea dictumst. lacus ac velit ornare lobortis의 Curabitur. 큐라
답변
UTF-8 문자는 1-4 바이트이므로 인코딩하는 문자에 따라 다릅니다. 대부분의 영어는 각 문자에 대해 1 바이트를 사용합니다. 다른 서양 언어는 2 바이트를 사용합니다. 아시아 문자는 4 바이트를 사용할 수 있습니다.
따라서 대답은 문자에 따라 1024에서 4096까지입니다. 또한 Windows 환경에서는 문서 시작 부분에 3 바이트 BOM이 필요하여 4Kb에 맞출 수있는 문자 수를 줄일 수 있습니다. UTF-8에 대한 wikipedia 기사를 참조하십시오 .