<style> 
    code { font-family: Consolas, monospace; } 
    table { width: 100%; }
</style>

### C2184 Úvod do programování v Pythonu

# 3. Řetězce, vstup a výstup

## Znak (*character*)

- Je prvek konkrétní znakové sady

- Python 3 používá znakovou sadu *Unicode*

- Příklady znaků v Unicodu: 
  
  - `A b č 4 ( ) # , - Σ π Ж й 日 本 語 ¼`
  
  - Řídící (netisknutelné) znaky (např. nový řádek, zvonek)

## Řetězec (*string*)

- Posloupnost znaků

- Datový typ `str`
  - Python nemá speciální datový typ pro samotný znak, jedná se o řetězec délky 1

### Zápis řetězců

- Ohraničujeme je pomocí `'` nebo `"` nebo `'''` nebo `"""`

- Příklad: 4 ekvivalentní zápisy slova Hello

```
'Hello'
"Hello"
'''Hello'''
"""Hello"""
```

- Pozor při kopírování: "sexy" uvozovky nefungují! 

  - `"Hello"`  ~~`“Hello”`~~  ~~`„Hello“`~~  `'Hello'`  ~~`‘Hello’`~~  ~~`‚Hello‘`~~  ~~`` `Hello` ``~~  

### Výpis řetězců

In [None]:
message = 'Já jsem řetězec.'

- Výpis řetězce funkcí `print`

  - V normálním i interaktivním módu

  - Uvozovky se nevypisují (nejsou součástí řetězce)

In [None]:
print(message)

- Výpis řetězce jako hodnoty

  - Pouze v interaktivním módu

  - Vypisuje se tak, jak bychom ho zapsali my v kódu, včetně uvozovek

In [None]:
message

### Víceřádkové řetězce

- Musíme použít `'''` nebo `"""`

In [None]:
message2 = "dlouhy retezec 
pres hodne radku"
print(message2)

In [None]:
message2 = """dlouhy retezec
pres hodne radku"""
print(message2)

### Řetězce s uvozovkami / apostrofy

In [None]:
print('I'm sorry.')

In [None]:
print("I'm sorry.")

In [None]:
print("Say "hello".")

In [None]:
print('Say "hello".')

In [None]:
print('''I can't say "hello".''')

### Speciální znaky a escapování

- Speciální znaky je možné zapsat pomocí zpětného lomítka (*backslash*) `\`

- Nejdůležitější speciální znaky:

    - `\n`   nový řádek

    - `\t`   tabulátor 
  
    - `\'`   apostrof
  
    - `\"`   uvozovky
  
    - `\\`   zpětné lomítko

In [None]:
print('A\tB\nC\\nD')

### Otázky:

Který z těchto řetězců je správne zapsaný?

- A) `'Tento text je`   
`hrozně dlouhý'`

- B) `'''Tento text je`    
`ještě o hodně`   
`delší'''`

- C) `'text\'`

- D) `'pštros s pštrosicí"`

Který z těchto řetězců je nejdelší (má nejvíc znaků)?

- A) `'bim bam'`

- B) `"""pštros"""`

- C) `"pš\t\t\tt"`

- D) `str(10+10+10)`

## Operace s řetězci

### Délka řetězce

- Funkce `len`

In [None]:
len('ahoj')

In [None]:
len('Dobrý den.\n')

In [None]:
len('')

### Spojování řetězců (sřetězení, *concatenation*)

- Operátor `+`

In [None]:
'dvě' + ' ' + 'slova'

In [None]:
a = 2
b = 'slova'
str(a) + ' ' + b

In [None]:
a + b

### Násobení řetězců

- Operátor `*`

In [None]:
'ha' * 5

## Indexování řetězců

- Pomocí `[]` a indexu můžeme získat konkrétní znak z řetězce

- Znaky indexujeme zleva, od 0

- Záporné indexy se počítají zprava, od -1


```
--->   0    1    2    3    4    5    6    7    8    9   10
```

<b>

```
       H    e    l    l    o         W    o    r    l    d
```

</b>

```
     -11  -10   -9   -8   -7   -6   -5   -4   -3   -2   -1  <---
```

In [None]:
retezec = 'Hello World'

In [None]:
retezec[0]

In [None]:
retezec[1]

In [None]:
retezec[-1]

In [None]:
retezec[-2]

### Podřetězec

- Rozsah zapisujeme `[start:stop]`
- Index `start` je zahrnut ve výsledku, index `stop` nikoliv!

- Prázdne `start` znamená od začatku
- Prázdné `stop` znamená do konce

In [None]:
message = 'Hello World'

In [None]:
message[2:5]

In [None]:
message[-4:]

In [None]:
message[:4]

In [None]:
message[:]

- Přeskakování znaků: `[start:stop:step]`

In [None]:
message = '0123456789'
message[1:8:2]

- Lze vynechat `start`, `stop`, nebo oboje

In [None]:
message[::3]

- Obrácení řetězce: nastavíme `step` na -1

In [None]:
message[::-1]

### Řetězce nelze upravovat (*strings are immutable*)

In [None]:
message = 'Hello World'

In [None]:
message[6]

In [None]:
message[6] = 'X'

In [None]:
message = message[:6] + 'X' + message[7:]
message

## Hledání podřetězců (*substrings*)

- Operátory `in`, `not in` testují jestli je/není jehla obsažena v kupce sena

In [None]:
'123' in 'ABCDefgh1234'

In [None]:
'456' in 'ABCDefgh1234'

In [None]:
'456' not in 'ABCDefgh1234'

In [None]:
'ABCDefgh1234' in '123'

### Počítání a hledání

- Pomocí metody `count` počítáme počet výskytů jehel v kupce sena

- Pomocí metody `find` hledáme index prvního výskytu jehly

(Metoda = funkce, kterou voláme přímo na nejakém objektu pomocí tečky.)

In [None]:
message = 'Nesnese se se sestrou.'
message.count('se')

In [None]:
'se'.count(retezec)

In [None]:
message.find('se')

In [None]:
message.find('SE')

### Hledání pouze na začátku / na konci

- Metody `startswith`, `endswith`

In [None]:
message = 'Nesnese se se sestrou.'
message.startswith('se')

In [None]:
message.startswith('Nes')

In [None]:
message.endswith('.')

### Nahrazování

- Metoda `replace` nahradí starý podřetězec za nový

- Volitelný třetí parametr `count` nastaví maximalní počet nahrazení; pokud není nastavený, nahradí se všechny výskyty

In [None]:
'kormorán'.replace('or', 'ol')

In [None]:
'kormorán'.replace('or', '')

In [None]:
'kormorán'.replace('or', 'ol', 1)

### Odstranění bílých znaků na okrajích

- Metoda `strip` odstraní bílé znaky z obou konců řetězce

- Metoda `lstrip` odstraňuje pouze zleva (*left-strip*)

- Metoda `rstrip` odstraňuje pouze zprava (*right-strip*)

- Bílé znaky uvnitř řetězce jsou zachovány 

- (Volitelný parametr těchto metod popisuje, jaké znaky se mají z okrajů odstranit.)

In [None]:
message = '    já jsem nepovedený \n řetězec   \t\n'

In [None]:
message.strip()

In [None]:
message.lstrip()

In [None]:
message.rstrip()

In [None]:
message.rstrip('\n\t')

### Rozdělění řetězce na části

- Metoda `split` rozdělí řetězec dle zadaného separátoru

- Parametr `sep` nastavuje separátor. Defaultní separátor jsou všechny shluky bílých znaků (mezera, `\t`, `\n`...)

- Parametr `maxsplit` omezuje počet dělení. Defaultní `maxsplit` je ∞

- (Tato metoda vrací *seznam* řetězců. O seznamech si víc řekneme později.)

In [None]:
message = 'dvě slova \n\ntři celá slova'
message.split()

In [None]:
message.split(sep='\n')

In [None]:
message.split(sep=' ', maxsplit=2)

In [None]:
message.split(sep='lo')

- Rozbalení seznamu:

In [None]:
name, surname = 'Jan Novák'.split()
name

In [None]:
surname

### Změna velikosti písma

In [None]:
message = 'Hello world!'

In [None]:
message.upper()

In [None]:
message.lower()

In [None]:
message.swapcase()

In [None]:
message.capitalize()

In [None]:
message.title()

### Logické operace

- `isalpha` – obsahuje pouze písmena?

- `isdigit` – obsahuje pouze číslice?

- `isalnum` – obsahuje pouze písmena a číslice?

- `isspace` – obsahuje pouze bílé znaky?

- `isupper`, `islower` – jsou všechna písmena velká/malá?

In [None]:
'Python3'.isalnum()

In [None]:
'Python 3'.isalnum()

In [None]:
' \t\n\r'.isspace()

In [None]:
'a \t\n\r'.isspace()

In [None]:
'Mám 5 jablíček.'.islower()

In [None]:
'mám 5 jablíček.'.islower()

In [None]:
'A Je To Tady'.istitle()

### Otázky:

`text = 'Lorem ipsum dolor sit amet'`

Který z těchto výrazů vrátí `True`?

- A) `text[5] == 'm'`

- B) `text[1:4] == 'orem'`.

- C) `' ' in text`

- D) `text.isalpha()`


Který z těchto výrazů vrátí `True`?

- A) `text.replace('n', 'f') == text`

- B) `text.strip('Lol') == text`

- C) `'abc' + 'def' == 'abc def'`

- D) `"5" * 5 == '55555'`


Který z těchto výrazů vrátí `True`?

- A) `'Brrrrr no to je zima'.strip('Br').startswith('no')`

- B) `'Brno'.replace('r','rrrrr')[-1] == 'n'`

- C) `'Toto léto stojí za to'.count('to') <= 4`

- D) `'Brno'.find('r') == 'Olomouc'.find('o')`

## Formátování řetězce

- **Old style** – pomocí `%` (zastaralé, nepoužívat)

- **New style** – pomocí metody `format`

- **f-strings**

In [None]:
name = 'Anička'
age =  5

print('Jmenuji se %s a je mi %d let.' % (name, age))      # old style

print('Jmenuji se {} a je mi {} let.'.format(name, age))  # new style

print(f'Jmenuji se {name} a je mi {age} let.')            # f-string

### f-strings

- Nejnovější a nejpraktičtější způsob

- "The best of Python 3.6"

- Těsně před řetězec vložíme `f`, v řetězci pak můžeme použít značky `{}`

- Za značku `{x}` se do f-stringu dosadí `str(x)`

In [None]:
name = 'Anička'
age = 5
what = 'Prasátko Peppa'

f'Jmenuji se {name}, je mi {age} let, líbí se mi {what}.'

#### Typy a formátování

- Ve značce za dvojtečkou můžeme specifikovat:

  - Zarovnání: `{x:<}`, `{x:>}` nebo `{x:^}` 

  - Délku: `{x:10}`

  - Počet desetinných míst: `{x:.2}`

  - Typ/formát: `{x:s}` řetězec, `{x:n}` číslo, `{x:f}` reálné číslo, `{x:e}` vědecký formát čísla...

- Zadané pořadí je nutné dodržet

In [None]:
f'{age}'  # Defaultní formát

In [None]:
f'{age:.3f}'  # Reálné číslo se 3 des. místy

In [None]:
f'{age:>20.2e}'  # Vědecký formát se 2 des. čísly, roztáhni na 20 znaků a zarovnej doprava

In [None]:
f'{age:^20.2E}'

In [None]:
f'Jmenuji se {name}, je mi {age:.2f} let, líbí se mi {what:^25}.'

### Metoda `format`

- Umožňuje nám připravit si šablonu se značkami `{}`

- Značky se nahradí až při volání metody `format` z její parametrů

In [None]:
template = 'Jmenuji se {name}, je mi {age:.1f} let, líbí se mi {what:^25}.'  # Toto není f-string, pouze šablona
template

In [None]:
template.format(name='Anička', age=5.123456, what=what)

In [None]:
template.format(age=2*50, name='Sigmund', what='Monty Python')

- Značky nemusíme pojmenovávat:

In [None]:
template = 'Jmenuji se {}, je mi {:.1f} let, líbí se mi {}.'
template.format('Anička', 5, 'Prasátko Peppa')

- Značky můžeme indexovat (od 0, žádné číslo v sekvenci nesmí chybět)

In [None]:
template = 'Jmenuji se {2}, je mi {1:.1f} let, líbí se mi {0}.'
template.format('Anička', 5, 'Prasátko Peppa')

## Vstup a výstup

Vstup (*input*) / standardní vstup (*stdin*)

- Slouží pro předání informací do běžícího programu

- Funkce `input`

Výstup (*output*) / standardní výstup (*stdout*)

- Slouží pro předání informací ven z běžícího programu

- Funkce `print`

### Funkce `input`

- Uživateli vypíše hlášku (nepovinné)

- Čeká na vstup od uživatele až do stisknutí klávesy Enter

- Výsledkem funkce je řetězec, který zadal uživatel (vždy typu `str`)

Zkuste si spustiť tento kód:

In [None]:
name = input('Jak se jmenuješ? ')
age = input('Kolik ti je let? ')
what = input('Co se ti líbí? ')
print(f'Jmenuješ se {name}, je ti {age} let, líbí se ti {what}.')

In [None]:
number = input()  # input() bez hlášky
print(2 * int(number))

### Funkce `print`

- Všechny své parametry přemění na řetězce (pomocí funkce `str`) a vypíše je

In [None]:
print('ahoj', 5, True)

### Speciální parametry funkce `print`

- Parametr `sep` (default je `' '`)

In [None]:
print(1, 2, 3)

In [None]:
print(1, 2, 3, sep=', ')

In [None]:
print(1, 2, 3, sep='\n')

In [None]:
print(1, 2, 3, sep='')

- Parametr `end` (default je `'\n'`)

In [None]:
print(1, 2, 3)
print(4, 5, 6)

In [None]:
print(1, 2, 3, end='; ')
print(4, 5, 6)

In [None]:
print(1, 2, 3, sep=',', end='')
print(4, 5, 6, sep='|', end='.')

### Otázky:

Který z těchto príkazů NEVYPÍŠE na výstup `True`?

- A) `print('False' in 'False')`

- B) `print('Torture'[0::2])`

- C) `print('Tr', 'U'.lower(), 'e', sep='')`

- D) `print('True'.isupper)`


Který z těchto výrazů se vyhodnotí na řetězec obsahující znak `{` ?

- A) `f'Number: {123}'`

- B) `'Number: {}' * len('')`

- C) `'Number: {}'.format('{123}')`

- D) `'Number: {}'.format(len(''))`

Napsali jsme si tento skript: 

```
text = input('Zadej počet a druh ovoce: ')
a, b = text.split()
print(int(a) * len(b))
```

Co může být zobrazeno na terminále po spuštění skriptu?

- A) 

    ```
    Zadej počet a druh ovoce: 10 jablek
    60
    ```

- B) 

    ```
    Zadej počet a druh ovoce: 10 granátových jablek
    180
    ```

- C) 

    ```
    Zadej počet a druh ovoce: '3 melouny'
    21
    ```

- D) 

    ```
    Zadej počet a druh ovoce:
    5 švestek
    35
    ```


## Reprezentace znaků v počítači

- Každý znak v znakové sadě je reprezentován svým ordinálním číslem

- Funkce `ord` zjišťuje ordinální číslo znaku

- Opakem je funkce `chr`, která vrací znak pro zadané ordinální číslo

### Znaková sada ASCII = prvních 128 znaků sady Unicode

**Dec** = ord. č. v desítkové soustavě, **Hex** = ord. č. v šestnáctkové soustavě, **Char** = znak

|Dec|Hex|Char| |Dec|Hex|Char| |Dec|Hex|Char| |Dec|Hex|Char| 
|---:|:--:|:---|---|---:|:--:|:---|---|---:|:--:|:---|---|---:|:--:|:---|
| **0** | 00 | *Null* | | **32** | 20 | *Space* | | **64** | 40 | `@` | | **96** | 60 | `` ` `` | 
| **1** | 01 | *Start of heading* | | **33** | 21 | `!` | | **65** | 41 | `A` | | **97** | 61 | `a` | 
| **2** | 02 | *Start of text* | | **34** | 22 | `"` | | **66** | 42 | `B` | | **98** | 62 | `b` | 
| **3** | 03 | *End of text* | | **35** | 23 | `#` | | **67** | 43 | `C` | | **99** | 63 | `c` | 
| **4** | 04 | *End of transmit* | | **36** | 24 | `$` | | **68** | 44 | `D` | | **100** | 64 | `d` | 
| **5** | 05 | *Enquiry* | | **37** | 25 | `%` | | **69** | 45 | `E` | | **101** | 65 | `e` | 
| **6** | 06 | *Acknowledge* | | **38** | 26 | `&` | | **70** | 46 | `F` | | **102** | 66 | `f` | 
| **7** | 07 | *Bell* `\a` | | **39** | 27 | `'` | | **71** | 47 | `G` | | **103** | 67 | `g` | 
| **8** | 08 | *Backspace* `\b` | | **40** | 28 | `(` | | **72** | 48 | `H` | | **104** | 68 | `h` | 
| **9** | 09 | *Tab* `\t` | | **41** | 29 | `)` | | **73** | 49 | `I` | | **105** | 69 | `i` | 
| **10** | 0a | *Line feed* `\n` | | **42** | 2a | `*` | | **74** | 4a | `J` | | **106** | 6a | `j` | 
| **11** | 0b | *Vertical tab* `\v` | | **43** | 2b | `+` | | **75** | 4b | `K` | | **107** | 6b | `k` | 
| **12** | 0c | *Form feed* `\f` | | **44** | 2c | `,` | | **76** | 4c | `L` | | **108** | 6c | `l` | 
| **13** | 0d | *Carriage return* `\r` | | **45** | 2d | `-` | | **77** | 4d | `M` | | **109** | 6d | `m` | 
| **14** | 0e | *Shift out* | | **46** | 2e | `.` | | **78** | 4e | `N` | | **110** | 6e | `n` | 
| **15** | 0f | *Shift in* | | **47** | 2f | `/` | | **79** | 4f | `O` | | **111** | 6f | `o` | 
| **16** | 10 | *Data link escape* | | **48** | 30 | `0` | | **80** | 50 | `P` | | **112** | 70 | `p` | 
| **17** | 11 | *Device control 1* | | **49** | 31 | `1` | | **81** | 51 | `Q` | | **113** | 71 | `q` | 
| **18** | 12 | *Device control 2* | | **50** | 32 | `2` | | **82** | 52 | `R` | | **114** | 72 | `r` | 
| **19** | 13 | *Device control 3* | | **51** | 33 | `3` | | **83** | 53 | `S` | | **115** | 73 | `s` | 
| **20** | 14 | *Device control 4* | | **52** | 34 | `4` | | **84** | 54 | `T` | | **116** | 74 | `t` | 
| **21** | 15 | *Neg. acknowledge* | | **53** | 35 | `5` | | **85** | 55 | `U` | | **117** | 75 | `u` | 
| **22** | 16 | *Synchronous idle* | | **54** | 36 | `6` | | **86** | 56 | `V` | | **118** | 76 | `v` | 
| **23** | 17 | *End trans. block* | | **55** | 37 | `7` | | **87** | 57 | `W` | | **119** | 77 | `w` | 
| **24** | 18 | *Cancel* | | **56** | 38 | `8` | | **88** | 58 | `X` | | **120** | 78 | `x` | 
| **25** | 19 | *End of medium* | | **57** | 39 | `9` | | **89** | 59 | `Y` | | **121** | 79 | `y` | 
| **26** | 1a | *Substitution* | | **58** | 3a | `:` | | **90** | 5a | `Z` | | **122** | 7a | `z` | 
| **27** | 1b | *Escape* | | **59** | 3b | `;` | | **91** | 5b | `[` | | **123** | 7b | `{` | 
| **28** | 1c | *File separator* | | **60** | 3c | `<` | | **92** | 5c | ` \ ` | | **124** | 7c | `|` | 
| **29** | 1d | *Group separator* | | **61** | 3d | `=` | | **93** | 5d | `]` | | **125** | 7d | `}` | 
| **30** | 1e | *Record separator* | | **62** | 3e | `>` | | **94** | 5e | `^` | | **126** | 7e | `~` | 
| **31** | 1f | *Unit separator* | | **63** | 3f | `?` | | **95** | 5f | `_` | | **127** | 7f | *Delete* | 

In [None]:
ord('A')

In [None]:
ord('č')

In [None]:
chr(65)

In [None]:
chr(269)

In [None]:
chr(127159)

- Escapování pomocí ordinálních čísel:

  - `\x??`, kde ?? je ordinální číslo znaku v šestnáctkové soustavě

  - `\u????`, kde ???? je ordinální číslo znaku šestnáctkové soustavě

  - `\U????????`, kde ???????? je ordinální číslo znaku v šestnáctkové soustavě
  
  - `\N{name}`, kde name je název Unicode znaku

In [None]:
print('\x7A \u007A \U0000007A \U0001F0B9')

In [None]:
print('\N{pound sign} \N{playing card seven of spades}')