UTF-8 encoder allows to encode codepoints in range #xD800 - #xDFFF

Such code-points do not represent unicode characters.
This also breaks the non-ambiguity of `:utf-8` encoding:
```lisp
(babel:string-to-octets (string (code-char #xd800)))
; => #(237 160 128)
(babel:octets-to-string *)
; Evaluation aborted on #<BABEL-ENCODINGS:CHARACTER-OUT-OF-RANGE {10053D9533}>.
```
For example sbcl throws an error in such case:
```lisp
(sb-ext:string-to-octets (string (code-char #xd800)))
; Evaluation aborted on #<SB-IMPL::OCTETS-ENCODING-ERROR {10013BEA23}>.
```

This seems to affect some other utf/ucs encodings as well (like `:utf-16be` or `:utf-16le`).

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

UTF-8 encoder allows to encode codepoints in range #xD800 - #xDFFF #47

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

UTF-8 encoder allows to encode codepoints in range #xD800 - #xDFFF #47

Description

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions